Администрирование [bigdata team] Практический курс по Big Data. Часть 3. RT, NoSQL, Data layout, Kafka (2023)


Дева Мариан

Уверенная в себе
Команда форума
Редактор
Премиум
Активный участник
Регистрация
13 Июл 2018
Сообщения
18.308
Реакции
186.975
Монетки
87363.5
    Голосов: 0
    0.0 5 0 0 https://s1.rwnd.pro/threads/bigdata-team-%D0%9F%D1%80%D0%B0%D0%BA%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D0%B9-%D0%BA%D1%83%D1%80%D1%81-%D0%BF%D0%BE-big-data-%D0%A7%D0%B0%D1%81%D1%82%D1%8C-3-rt-nosql-data-layout-kafka-2023.135045/
  • #1
Автор: bigdata team
Название: Практический курс по Big Data. Часть 3. RT, NoSQL, Data layout, Kafka (2023)

1704465930158.png


Описание:

Вы научитесь работать с потоковой обработкой данных, познакомитесь с Kafka и Spark Structured Streaming, освоите NoSQL поверх больших данных, подружите Spark с Cassandra.

Подробнее о каждом модуле и полезных навыках, которые вы освоите в модуле, мы рассказали ниже.

В этом модуле вы изучите:
▶ подходы к Realtime-обработке;
▶ гарантии обработки, переход от одной гарантии к другой, архитектуры "Лямбда" и "Каппа";
▶ Spark Streaming vs. Spark RDD, Spark Structured Streaming vs. Spark DataFrames, DStream;
▶ архитектура Kafka, Kafka Streams, репликация в Kafka. Отличие Kafka от классических очередей;
▶ семантики доставки сообщений, сжатие данных в Kafka, синхронная и асинхронная репликация.
▶ отличия Key-Value хранилищ от реляционных БД;
▶ компактификация и её виды, CQLSH;
▶ архитектура Cassandra;
▶ обеспечение надёжности и высокодоступности в Key-Value хранилищах;
▶ интеграция Spark с Cassandra.
▶ как бороться с Data Skew с помощью MapReduce подходов в разных фреймворках;
▶ trade-off между CPU и IO-bound приложениями, подходы к сжатию в Big Data, горячие и холодные данные;
▶ форматы данных в Big Data: ORC vs Parquet, Avro, ...

Подробнее:
Для просмотра содержимого вам необходимо авторизоваться.

Скачать:
Скрытое содержимое могут видеть только члены группы Премиум.