Проект: X5. Ищем Middle Data Scientist для услуги DA (подбор предложений).

Требования:

  • Профильное образование или сертификаты в области анализа данных и машинного обучения.
  • Опыт работы в области Data Science от 2 лет.
  • Python (с соблюдением PEP 8), умение писать продуктивный, оптимальный по времени и памяти код; OOP.
  • Знание стандартных алгоритмов и структур данных; навыки дебага и оптимизации кода; разработка через тестирование (TDD).
  • Работа с данными: SQL на базовом уровне (join, GROUP BY), реляционные БД, оконные функции.
  • Опыт работы с PySpark (broadcast join и пр.), знакомство со Spark UI, Spark 2.2+.
  • Математика: базовая теория вероятностей и статистика; продвинутое владение методами проверки гипотез (множественная проверка, параметрические/непараметрические методы, бутстреп); понимание A/B-тестирования и полного цикла проведения экспериментов.
  • Знание классических методов ML; опыт изучения и имплементации продвинутых моделей (байесовские модели / PGM / VBI, RL).
  • Навыки продуктовой аналитики: декомпозиция бизнес-задач, построение аналитических отчётов, работа с метриками продукта.

Стек и инструменты: Python; SQL; PySpark / Spark; matplotlib; seaborn; plotly; BI-инструменты; Git; PyTest; Grafana; Airflow.

Задачи:

  • Выбор и построение математических моделей для решения задач.
  • Декомпозиция задач, определение пути решения и сроков.
  • Проверка гипотез статистическими методами и презентация результатов бизнес-заказчику.
  • Написание оптимальных SQL/PySpark-запросов, укладывающихся в SLA, и переиспользуемого продуктивного кода.
  • Создание простых аналитических сервисов (MVP), code-review, постановка регулярных процессов и настройка мониторинга качества.
  • Участие в формировании ТЗ и менторинг Junior специалистов.