Реклама — один из самых высоконагруженных сервисов Яндекса. Она выдерживает до 700K RPS и работает с миллиардами объявлений. За качество рекламного ранжирования отвечают сотни ML-моделей. Отдел ML-разработчиков непрерывно обучает новые, более совершенные модели. Одна из сложных проблем, которая сильно влияет на метрики онлайн-экспериментов, — расхождение между данными в обучении и применении (training-serving skew). В Feature Store мы развиваем метаслой. Он позволяет ML-разработчикам легко конструировать и переиспользовать признаки для моделей в контексте low latency (RT-применение моделей) и high throughput (дообучение моделей на кластере).

Обязанности:

Интеграция с сервисами Поиска и Рекламы
Feature Store уже стал стандартом для внедрений нейронок в Рекламе, и вы будете помогать нам дальше внедряться в различные сервисы, включая Поиск и Рекламу, а также адаптироваться под нужды новых классов моделей (генеративных трансформеров). Вам предстоит решать разные задачи: от оптимизации вычислений на C++ до разработки Python-интерфейсов для пользователей и интеграции с внутренними сервисами (YQL, Model Registry, сервисы моделей). Ваши знания помогут улучшить опыт пользователей, ускорить запуск новых моделей и сэкономить ресурсы. Больше о бэкенде в Яндексе — в канале Yandex for Backend

Ключевые навыки:

  • Хорошо владеете C++
  • Работали с высоконагруженными системами
  • Знаете классические алгоритмы и структуры данных
  • Имели опыт работы с Python

Дополнительные требования:

  • Знакомы с концепцией MapReduce и движками распределённого вычисления (Hive, Spark, YT)