Закладки0
UsupovMarket / Курсы по программированию / [bigdata team] Практический курс по Big Data. Часть 1. HDFS, Map Reduce, Hive
Почему такая цена?
  • Добавлено: 2023-05-05
  • Сайт автора: Перейти
  • Доступ: Облако Mail / Yandex / Google
  • Загрузка: PC / Smartphone / Tablet
Вы научитесь работать с распределенными файловыми системами, познакомитесь с экосистемой Hadoop, разберетесь с оптимизацией MapReduce вычислений и работой с Hive.

Часть 1.
HDFS, Map Reduce, Hive

В этом модуле вы изучите:

вводная часть: знакомство (задачи, оценки, дедлайны), подробности курса;
распределенные файловые системы (GFS, HDFS). Их составляющие, достоинства, недостатки и сфера применения;
чтение и запись в HDFS. HDFS APIs: Web, shell.
Hadoop Streaming;
элементы Hadoop-задачи (Mapper, reducer, combiner, partitioner, comparator).
приложения с несколькими Hadoop-задачами;
тюнинг Hadoop-job (настройка партиционирования, сложные ключи, uber jobs);
задачи с несколькими входами. Joins в Hadoop.
архитектура Hive, виды таблиц, форматы хранения данных;
трансляция Hive-запросов в MapReduce-задачи;
сериализация и десериализация;
тюнинг Join'ов в Hive;
партиционирование, бакетирование, семплирование;
User defined functions, Hive Streaming.

Отзывы

(Читать все отзывы ->)
Минимальная длина отзыва - 50 знаков.
Или
Кликните на изображение чтобы обновить код, если он неразборчив

С этим курсом также покупают

Больше курсов из категории «Курсы по программированию»