Закладки0
UsupovMarket / Курсы по программированию / [bigdata team] Практический курс по Big Data. Часть 3. RT, NoSQL, Data layout, Kafka
Почему такая цена?
  • Добавлено: 2023-05-05
  • Цена у автора: 25000 руб.
  • Сайт автора: Перейти
  • Доступ: Облако Mail / Yandex / Google
  • Загрузка: PC / Smartphone / Tablet
Вы научитесь работать с потоковой обработкой данных, познакомитесь с Kafka и Spark Structured Streaming, освоите NoSQL поверх больших данных, подружите Spark с Cassandra.

Подробнее о каждом модуле и полезных навыках, которые вы освоите в модуле, мы рассказали ниже.

В этом модуле вы изучите:
подходы к Realtime-обработке;
гарантии обработки, переход от одной гарантии к другой, архитектуры "Лямбда" и "Каппа";
Spark Streaming vs. Spark RDD, Spark Structured Streaming vs. Spark DataFrames, DStream;
архитектура Kafka, Kafka Streams, репликация в Kafka. Отличие Kafka от классических очередей;
семантики доставки сообщений, сжатие данных в Kafka, синхронная и асинхронная репликация.
отличия Key-Value хранилищ от реляционных БД;
компактификация и её виды, CQLSH;
архитектура Cassandra;
обеспечение надёжности и высокодоступности в Key-Value хранилищах;
интеграция Spark с Cassandra.
как бороться с Data Skew с помощью MapReduce подходов в разных фреймворках;
trade-off между CPU и IO-bound приложениями, подходы к сжатию в Big Data, горячие и холодные данные;
форматы данных в Big dаta: ORC vs Parquet, Avro

Отзывы

(Читать все отзывы ->)
Минимальная длина отзыва - 50 знаков.
Или
Кликните на изображение чтобы обновить код, если он неразборчив

С этим курсом также покупают

Больше курсов из категории «Курсы по программированию»