Что нужно делать:
- Вести разработку ETL-процессов поставки данных;
- Выявлять неэффективность в существующих процессах и оптимизировать их;
- Проектировать структуру хранения данных;
- Участвовать в развитии фреймворка поставки данных;
- Погружаться в данные одной из прикладных бизнес-областей и становиться в них экспертом;
- Сопровождать разработанные процессы ETL.
Мы ждем, что вы:
- Уверенно знаете Python на уровне написания собственного фреймворка или SQL на уровне оптимизации запросов
- Знаете основные алгоритмы и структуры данных, особенно используемые в области работы с большими данными.
Будет плюсом, если вы:
- Проектировали DWH: слои, модели хранения данных, процессы ETL;
- Понимаете принципы работы хотя бы одной технологии распределенной обработки данных;