Описание:
По результатам модуля:
- добавляем stream-источник
- создаем схему в хранилище
- создаем дизайн
- оптимизируем под задачу
- Семейство MPP баз - назначение и особенности
- Логический и физический дизайн
- Vertica
Студент научится:
- Выстраивать работу с СУБД в соответствии с лучшими практиками
- Выбрать подход для моделирования витрин в DWH
- Использовать фреймворк DBT для построения витрины
Краткое содержание:
- Лучшие практики работы с Аналитическими СУБД
- Логический и физический дизайн
- Data Build Tool (dbt)
Результаты занятия:
- Студент готов построить витрину данных в DWH с использованием DBT
- NoSQL Databases. HBase, Cassandra, Elasticsearch, Aerospike
- Key-value
- Cache
- SQL - межгалактический язык работы с данными
- Развернуть дистрибутив CDH
- Самостоятельно проделать манипуляции с Hive с приложенными скриптами
- Знакомство с компонентами ELK-стэка
- Классы задач, для которых подходит ELK