Проект: крупная ритейл компания.
Условия: удаленно, фулл тайм, локация/гражданство: любая.
Требования:
- Знание SQL (индексы, функции, оптимизация, профилирование производительности)
- Опыт работы с реляционными БД: Postgres, Oracle, MySQL, MsSQL, DB2 и т.п.
- Понимание/опыт со стеком S3, Trino, ClickHouse, Greenplum, Hive
- Умение работать с Git
- Опыт работы с DBT, Cosmos
- Понимание устройства Iceberg и форматов данных
- Базовые навыки работы с данными на Python
- Опыт использования систем ведения проектов и документации
Задачи:
- Вести разработку согласно ТЗ; дорабатывать существующие витрины EDW и разрабатывать новые
- Разрабатывать типовые потоковые интеграционные решения на стеке: Trino, Iceberg, S3, Spark, Apache Airflow, Kafka, Cosmos, Flink
- Поддерживать в актуальном состоянии документацию платформы больших данных
- Предоставлять отчетность о своей деятельности руководителю