Мы ищем Data Engineer, который будет участвовать в развитии нашей Data Platform, создании ETL/ELT-процессов и витрин данных для продуктовой и аналитической нагрузки.
Обязанности:
- Оптимизация SQL-запросов, проектирование витрин, работа с DWH
- Эксплуатация ClickHouse, работа с Greenplum (PostgreSQL-экосистема)
- Проектирование DWH (ODS/DWD/DM), моделирование витрин и data marts
- Построение ETL/ELT пайплайнов
- Проектирование витрин данных
- Кастомизация Superset, Data Applications
- Кастомизация Superset backend, автоматизация
- Поддержка Data Platform, эксплуатация DWH
- Любая современная разработка Data Platform
Требования:
- Уверенное знание SQL: сложные JOIN’ы, оконные функции, CTE, оптимизация запросов
- Опыт работы с аналитическими БД: ClickHouse / PostgreSQL / StarRocks / Apache Doris
- Понимание построения DWH: fact / dimension таблицы, star schema, data marts, SCD
- Опыт работы с ETL/ELT процессами
- Навыки моделирования данных и построения витрин
- Опыт работы с BI-инструментами: Apache Superset / Metabase / Power BI
- Базовые знания Python: pandas, автоматизация, работа с API
- Понимание качества данных: валидации, мониторинг, контроль консистентности
- Опыт работы с Git
- Будет плюсом:
- Опыт работы с: Apache Airflow, dbt, Apache Spark, Apache Kafka
- Понимание CI/CD для data pipelines
- Молодой и дружный коллектив
- Официальное трудоустройство
- Участие в крупных государственных проектах
- Возможность карьерного и профессионального роста