В формате сотрудничества через ИП ищем Data Engineer с функциями Data Analyst, сфера: финтех.
Требования:
- Опыт работы с реляционными БД; умение создавать и оптимизировать сложные SQL-запросы.
- Проектирование и создание моделей данных для аналитики и эффективной работы DWH.
- Владение методологиями Data Vault и другими современными подходами к моделированию для обеспечения прозрачности, истории изменений и восстановления данных.
- Документирование моделей данных и поддержание совместимости с процессами ETL/ELT и бизнес-метриками.
- Умение управлять изменениями модели при росте объема данных и изменениях в требованиях аналитики.
- Язык программирования: Python.
- Объектное хранилище: S3.
- Стриминг данных: Kafka.
- Реляционные СУБД: Postgres, MSSQL.
- NoSQL: MongoDB.
- Аналитическая СУБД: Clickhouse.
- Опыт создания и поддержки ETL/ELT-конвейеров данных; знание dbt (шаблонизация, SQL в dbt).
- Опыт оркестрации процессов с Apache Airflow (настройка DAG, автоматизация и мониторинг ETL задач).
- Понимание методологий DataOps: контроль версий моделей, тестирование, мониторинг и безопасное развертывание.
- Навыки документирования процессов и работы с технической документацией.
Задачи:
- Анализ источников данных легаси БД MSSQL: сбор информации о наполнении, выявление ключевых бизнес-сущностей и зависимостей, регламентных операций.
- Проектирование и оптимизация потоков переноса данных из MSSQL в новое хранилище.
- Разработка и поддержка моделей данных и трансформаций в dbt для формирования конечных витрин.
- Организация и автоматизация процессов оркестрации с Airflow.
- Обеспечение качества, тестирование данных и их целостности при миграции и трансформации.
- Работа с потоками данных и интеграция с Kafka для обмена и передачи событий в реальном времени.
Условия: удаленный формат работы. Фултайм. Взаимодействие по схеме сотрудничества через ИП. Доход обсуждаем в зависимости от опыта.