В формате сотрудничества через ИП ищем Data Engineer с функциями Data Analyst, сфера: финтех.

Требования:

  • Опыт работы с реляционными БД; умение создавать и оптимизировать сложные SQL-запросы.
  • Проектирование и создание моделей данных для аналитики и эффективной работы DWH.
  • Владение методологиями Data Vault и другими современными подходами к моделированию для обеспечения прозрачности, истории изменений и восстановления данных.
  • Документирование моделей данных и поддержание совместимости с процессами ETL/ELT и бизнес-метриками.
  • Умение управлять изменениями модели при росте объема данных и изменениях в требованиях аналитики.
  • Язык программирования: Python.
  • Объектное хранилище: S3.
  • Стриминг данных: Kafka.
  • Реляционные СУБД: Postgres, MSSQL.
  • NoSQL: MongoDB.
  • Аналитическая СУБД: Clickhouse.
  • Опыт создания и поддержки ETL/ELT-конвейеров данных; знание dbt (шаблонизация, SQL в dbt).
  • Опыт оркестрации процессов с Apache Airflow (настройка DAG, автоматизация и мониторинг ETL задач).
  • Понимание методологий DataOps: контроль версий моделей, тестирование, мониторинг и безопасное развертывание.
  • Навыки документирования процессов и работы с технической документацией.

Задачи:

  • Анализ источников данных легаси БД MSSQL: сбор информации о наполнении, выявление ключевых бизнес-сущностей и зависимостей, регламентных операций.
  • Проектирование и оптимизация потоков переноса данных из MSSQL в новое хранилище.
  • Разработка и поддержка моделей данных и трансформаций в dbt для формирования конечных витрин.
  • Организация и автоматизация процессов оркестрации с Airflow.
  • Обеспечение качества, тестирование данных и их целостности при миграции и трансформации.
  • Работа с потоками данных и интеграция с Kafka для обмена и передачи событий в реальном времени.

Условия: удаленный формат работы. Фултайм. Взаимодействие по схеме сотрудничества через ИП. Доход обсуждаем в зависимости от опыта.