- Статус
- Вне сети
- Регистрация
- 31 Май 2022
- Сообщения
- 1.115
- Реакции
- 4
- Автор темы
- Администратор
- #1
Практический курс по Big Data. Часть 3. RT, NoSQL, Data layout, Kafka [bigdata team]
Вы научитесь работать с потоковой обработкой данных, познакомитесь с Kafka и Spark Structured Streaming, освоите NoSQL поверх больших данных, подружите Spark с Cassandra.
В этом модуле вы изучите:
- подходы к Realtime-обработке;
- гарантии обработки, переход от одной гарантии к другой, архитектуры "Лямбда" и "Каппа";
- Spark Streaming vs. Spark RDD, Spark Structured Streaming vs. Spark DataFrames, DStream;
- архитектура Kafka, Kafka Streams, репликация в Kafka. Отличие Kafka от классических очередей;
- семантики доставки сообщений, сжатие данных в Kafka, синхронная и асинхронная репликация.
- отличия Key-Value хранилищ от реляционных БД;
- компактификация и её виды, CQLSH;
- архитектура Cassandra;
- обеспечение надёжности и высокодоступности в Key-Value хранилищах;
- интеграция Spark с Cassandra.
- как бороться с Data Skew с помощью MapReduce подходов в разных фреймворках;
- trade-off между CPU и IO-bound приложениями, подходы к сжатию в Big Data, горячие и холодные данные;
- форматы данных в Big Data: ORC vs Parquet, Avro,
To view the content, you need to Sign In .
Похожие темы:
- [Куш Шарма] [Udemy] Seedance 2.0 - совершенная ИИ-видеомодель для видеопроизводства (2026)
- [Элеонора Тюрина] Маркетинговые стратегии в социальных сетях (2025)
- [Алексей Стэн] Трафик без лица (2026)
- [Анна Тетерлева] Дебиторская задолженность без ошибок: срок давности, резерв, списание, 1С (2026)
- [Мария Афонина] [Лабс] Интенсив по вайбкодингу (2026)
- [Алекс Исаков] Живой мастер-класс по Claude (2026)
- [Александр Пряхин] [Balun.Courses] Начинающий Team Lead. Тариф Стандарт (2026)
- [Эд Доннер, Лидженси] [Udemy] Полный курс по созданию ИИ-агентов и работе с MCP (2026)
- [Сергей Гунин] Гуру света. Фильм 10 — Финал. Самый востребованный свет (2025)
- [Антон Маркин] ИИшак (2026)