Локация: РФ. Формат: удаленно. Занятость: фулл тайм.
Проект: X5 — разработка моделей для IBP.
Требования:
- Алгоритмы и структуры данных; умение оценивать сложность алгоритмов; знание стандартного курса алгоритмов и структур данных; оценка сложности структур стандартной библиотеки.
- Знакомство с расширенными алгоритмами: вероятностные, алгоритмы во внешней памяти, алгоритмы на графах, ТВиМС.
- Предельные теоремы и умение их применять; проверка гипотез, бутстреп.
- A/B-тесты, variance reduction, causal inference.
- Понимание ML-алгоритмов и методов, умение адаптировать их и строить модели из стандартных компонент; знание жизненного цикла ML-разработки.
- Знакомство с менее распространёнными методами МО: байесовские модели/PGM/VBI, RL и прочее.
- MLOps: развёртывание и обновление моделей, версионирование моделей и данных, мониторинг работы моделей и качества данных.
- SQL: простые запросы, группировки, оконные функции, оптимизация запросов (в частности spark).
- Engineering: писать чистый код на Python, писать тесты, пользоваться git, дебажить чужой код, базовое понимание архитектуры и лучших практик разработки.
- DB & BD: промышленный опыт с несколькими системами, знание внутреннего устройства систем, оптимизация вычислений/запросов, транзакции/ACID, индексы.
- Умение декомпозировать задачи и самостоятельно находить решения.
Задачи:
- Разработка кода и тестов на Python, участие в командной разработке и код-ревью.
- Проработка и изменение дизайна существующих компонентов при необходимости.
- Подготовка и валидация обучающих выборок данных для внедрения и сопровождения математических моделей больших данных.
- Расчёт результатов и дизайн A/B-тестов.
- Внедрение современных методов машинного обучения и анализа данных в продуктах больших данных.
- Разворачивание моделей и сервисов в контуре X5 (hadoop/k8s/airflow).
- Написание и оптимизация SQL-запросов (включая spark).
- Инициирование идей по улучшению моделей, предложение прокси-метрик и функций потерь, контроль соответствия результатов в релизах.