Крупная ритейл компания ищет Senior Data Scientist на проект до 31.12.2026.

Локация: РФ

Обязательные требования:

  • Профильное образование или наличие сертификатов по специализациям анализа данных и машинного обучения.
  • Опыт работы в области data science от 3 лет.
  • Python (PEP 8), способность писать код по заданным стандартам качества.
  • Знание стандартных алгоритмов и структур данных.
  • Хорошее владение библиотеками для анализа данных и численных методов.
  • Умение писать оптимальный по времени и памяти код, проводить дебаг и оптимизацию кода, учитывать сложность алгоритмов.
  • Разработка через тестирование.
  • Свободное владение ООП.
  • Опыт проектирования архитектуры проектов.
  • Проектирование расписания процессов (Airflow, cron).
  • Передача проекта в production, опыт работы с CI/CD.
  • Работа с данными: SQL на базовом уровне (join, group by), опыт работы с реляционными БД.
  • Опыт работы на PySpark (broadcast join и т.д., Spark UI), знание оконных функций.
  • Знание преимуществ и недостатков различных типов баз данных.
  • Опыт разработки ETL пайплайнов.
  • Понимание транзакций, ACID, индексов.
  • Продвинутое владение аппаратом проверки гипотез: множественная проверка гипотез, параметрические/непараметрические методы, бутстреп.
  • Изучение и имплементация продвинутых моделей ML: байесовские модели, PGM, VBI, RL и др.
  • Знание методов снижения дисперсии в экспериментах.
  • Погружение в метрики продукта: понимание основных метрик продукта и их особенностей, перевод бизнес-задач в DS/DA/DE и декомпозиция комплексных бизнес-задач, построение прокси-метрик продукта.
  • Опыт формирования новых направлений для исследований.
  • Умение определить слабые/сильные стороны бизнес-логики продукта.
  • Умение консультировать и работать в плотную с продактом или бизнес-заказчиком.
  • Декомпозиция бизнес-целей в истории для анализа, оценка сроков решения задач.
  • Стек: Python, SQL, визуализация данных (matplotlib, seaborn, plotly / BI-инструменты), Git, PyTest, Spark 2.2+, Grafana, Airflow, Docker, Kubernetes (K8S).

Дополнительные требования:

  • Всегда проверяет данные на корректность перед использованием.
  • Умение реализовать любой запрос и определить неоптимальный запрос.
  • Умение разработать структуры БД, работать с планом запроса.
  • Знакомство с базовой теорией вероятности и статистикой.
  • Знание понятий A/B-тестирования и проверки гипотез.
  • Умение решать простые задачи по теории вероятности, статистике, логике.
  • Знание классических методов ML.
  • Знание полного цикла проведения A/B-теста.
  • Интуиция по возникновению шумов в данных и определению независимых групп, опыт анализа эффектов без контрольных и тестовых групп.
  • Опыт написания статей, выступления на конференциях.
  • Опыт работы с хорошо описанными задачами.
  • Построение аналитических отчётов с заданными требованиями.
  • Презентация аналитических изысканий, проверенных гипотез и т.д.
  • Умение поставить задачу мидлу.

Задачи на проекте:

  • Выбор и построение подходящих математических моделей для решения поставленных задач.
  • Выбор оптимальной архитектуры решения задач продукта.
  • Выявление слабых мест продукта и их устранение.
  • Поиск точек роста продукта.
  • Синтез оптимальных математических моделей для решения задач продукта.
  • Тесное взаимодействие с бизнес-заказчиком, консультантами и командой.
  • Постановка и проведение AA/AB/ABN-экспериментов.
  • Ведение кодовой базы продукта и поддержание её на стабильном высоком уровне.
  • Постановка задач и контроль их исполнения другими аналитиками.
  • Согласование решения задачи с руководством.
  • Презентация и защита результатов.

Длительность проекта: до 31.12.2026

Этапы отбора: 2 этапа: 1 ТИ и интервью с ПО.