Крупная ритейл компания ищет Senior Data Scientist на проект до 31.12.2026.
Локация: РФ
Обязательные требования:
- Профильное образование или наличие сертификатов по специализациям анализа данных и машинного обучения.
- Опыт работы в области data science от 3 лет.
- Python (PEP 8), способность писать код по заданным стандартам качества.
- Знание стандартных алгоритмов и структур данных.
- Хорошее владение библиотеками для анализа данных и численных методов.
- Умение писать оптимальный по времени и памяти код, проводить дебаг и оптимизацию кода, учитывать сложность алгоритмов.
- Разработка через тестирование.
- Свободное владение ООП.
- Опыт проектирования архитектуры проектов.
- Проектирование расписания процессов (Airflow, cron).
- Передача проекта в production, опыт работы с CI/CD.
- Работа с данными: SQL на базовом уровне (join, group by), опыт работы с реляционными БД.
- Опыт работы на PySpark (broadcast join и т.д., Spark UI), знание оконных функций.
- Знание преимуществ и недостатков различных типов баз данных.
- Опыт разработки ETL пайплайнов.
- Понимание транзакций, ACID, индексов.
- Продвинутое владение аппаратом проверки гипотез: множественная проверка гипотез, параметрические/непараметрические методы, бутстреп.
- Изучение и имплементация продвинутых моделей ML: байесовские модели, PGM, VBI, RL и др.
- Знание методов снижения дисперсии в экспериментах.
- Погружение в метрики продукта: понимание основных метрик продукта и их особенностей, перевод бизнес-задач в DS/DA/DE и декомпозиция комплексных бизнес-задач, построение прокси-метрик продукта.
- Опыт формирования новых направлений для исследований.
- Умение определить слабые/сильные стороны бизнес-логики продукта.
- Умение консультировать и работать в плотную с продактом или бизнес-заказчиком.
- Декомпозиция бизнес-целей в истории для анализа, оценка сроков решения задач.
- Стек: Python, SQL, визуализация данных (matplotlib, seaborn, plotly / BI-инструменты), Git, PyTest, Spark 2.2+, Grafana, Airflow, Docker, Kubernetes (K8S).
Дополнительные требования:
- Всегда проверяет данные на корректность перед использованием.
- Умение реализовать любой запрос и определить неоптимальный запрос.
- Умение разработать структуры БД, работать с планом запроса.
- Знакомство с базовой теорией вероятности и статистикой.
- Знание понятий A/B-тестирования и проверки гипотез.
- Умение решать простые задачи по теории вероятности, статистике, логике.
- Знание классических методов ML.
- Знание полного цикла проведения A/B-теста.
- Интуиция по возникновению шумов в данных и определению независимых групп, опыт анализа эффектов без контрольных и тестовых групп.
- Опыт написания статей, выступления на конференциях.
- Опыт работы с хорошо описанными задачами.
- Построение аналитических отчётов с заданными требованиями.
- Презентация аналитических изысканий, проверенных гипотез и т.д.
- Умение поставить задачу мидлу.
Задачи на проекте:
- Выбор и построение подходящих математических моделей для решения поставленных задач.
- Выбор оптимальной архитектуры решения задач продукта.
- Выявление слабых мест продукта и их устранение.
- Поиск точек роста продукта.
- Синтез оптимальных математических моделей для решения задач продукта.
- Тесное взаимодействие с бизнес-заказчиком, консультантами и командой.
- Постановка и проведение AA/AB/ABN-экспериментов.
- Ведение кодовой базы продукта и поддержание её на стабильном высоком уровне.
- Постановка задач и контроль их исполнения другими аналитиками.
- Согласование решения задачи с руководством.
- Презентация и защита результатов.
Длительность проекта: до 31.12.2026
Этапы отбора: 2 этапа: 1 ТИ и интервью с ПО.