Проект: X5. Ищем Middle Data Scientist для услуги DA (подбор предложений).
Требования:
- Профильное образование или сертификаты в области анализа данных и машинного обучения.
- Опыт работы в области Data Science от 2 лет.
- Python (с соблюдением PEP 8), умение писать продуктивный, оптимальный по времени и памяти код; OOP.
- Знание стандартных алгоритмов и структур данных; навыки дебага и оптимизации кода; разработка через тестирование (TDD).
- Работа с данными: SQL на базовом уровне (join, GROUP BY), реляционные БД, оконные функции.
- Опыт работы с PySpark (broadcast join и пр.), знакомство со Spark UI, Spark 2.2+.
- Математика: базовая теория вероятностей и статистика; продвинутое владение методами проверки гипотез (множественная проверка, параметрические/непараметрические методы, бутстреп); понимание A/B-тестирования и полного цикла проведения экспериментов.
- Знание классических методов ML; опыт изучения и имплементации продвинутых моделей (байесовские модели / PGM / VBI, RL).
- Навыки продуктовой аналитики: декомпозиция бизнес-задач, построение аналитических отчётов, работа с метриками продукта.
Стек и инструменты: Python; SQL; PySpark / Spark; matplotlib; seaborn; plotly; BI-инструменты; Git; PyTest; Grafana; Airflow.
Задачи:
- Выбор и построение математических моделей для решения задач.
- Декомпозиция задач, определение пути решения и сроков.
- Проверка гипотез статистическими методами и презентация результатов бизнес-заказчику.
- Написание оптимальных SQL/PySpark-запросов, укладывающихся в SLA, и переиспользуемого продуктивного кода.
- Создание простых аналитических сервисов (MVP), code-review, постановка регулярных процессов и настройка мониторинга качества.
- Участие в формировании ТЗ и менторинг Junior специалистов.