Проект: Data Lake в крупный медтех.

Стек:

Требования:

Опыт работы от 3 лет на аналогичной позиции или схожей
Практический опыт построения платформ данных с использованием Apache Iceberg на S3-совместимых хранилищах или Hadoop
Уверенное владение Python (включая PySpark)
Продвинутый опыт работы со PySpark (batch) с большими объёмами данных
Опыт проектирования и работы с таблицами в ClickHouse
Отличное знание SQL и опыт оптимизации под большие объёмы данных
Разработка, оптимизация и масштабирование ETL/ELT-процессов
Разработка и поддержка витрин данных для аналитики и бизнес-отчетности
Взаимодействие с аналитиками, специалистами Data Science и ML
Понимание принципов Data Lake / Data Lakehouse

Будет плюсом:

Задачи:

Изучение сырых данных на источнике и в Storage
Тесное взаимодействие с командами Data Science и ML
Разбор и устранение сложных инцидентов производительности в ClickHouse и PySpark
Проектирование и построение витрин данных в ClickHouse
Разработка и модификация ETL/ELT-процессов для Data Mart
Проведение код-ревью

Условия:

Senior Data Engineer

Job description