Локация: РФ. Формат: удаленно. Занятость: фулл тайм.

Проект: X5 — разработка моделей для IBP.

Требования:

  • Алгоритмы и структуры данных; умение оценивать сложность алгоритмов; знание стандартного курса алгоритмов и структур данных; оценка сложности структур стандартной библиотеки.
  • Знакомство с расширенными алгоритмами: вероятностные, алгоритмы во внешней памяти, алгоритмы на графах, ТВиМС.
  • Предельные теоремы и умение их применять; проверка гипотез, бутстреп.
  • A/B-тесты, variance reduction, causal inference.
  • Понимание ML-алгоритмов и методов, умение адаптировать их и строить модели из стандартных компонент; знание жизненного цикла ML-разработки.
  • Знакомство с менее распространёнными методами МО: байесовские модели/PGM/VBI, RL и прочее.
  • MLOps: развёртывание и обновление моделей, версионирование моделей и данных, мониторинг работы моделей и качества данных.
  • SQL: простые запросы, группировки, оконные функции, оптимизация запросов (в частности spark).
  • Engineering: писать чистый код на Python, писать тесты, пользоваться git, дебажить чужой код, базовое понимание архитектуры и лучших практик разработки.
  • DB & BD: промышленный опыт с несколькими системами, знание внутреннего устройства систем, оптимизация вычислений/запросов, транзакции/ACID, индексы.
  • Умение декомпозировать задачи и самостоятельно находить решения.

Задачи:

  • Разработка кода и тестов на Python, участие в командной разработке и код-ревью.
  • Проработка и изменение дизайна существующих компонентов при необходимости.
  • Подготовка и валидация обучающих выборок данных для внедрения и сопровождения математических моделей больших данных.
  • Расчёт результатов и дизайн A/B-тестов.
  • Внедрение современных методов машинного обучения и анализа данных в продуктах больших данных.
  • Разворачивание моделей и сервисов в контуре X5 (hadoop/k8s/airflow).
  • Написание и оптимизация SQL-запросов (включая spark).
  • Инициирование идей по улучшению моделей, предложение прокси-метрик и функций потерь, контроль соответствия результатов в релизах.