Мы развиваем поисковый саджест, spellchecker и классификацию запросов. Наши сервисы используются в почти всех продуктах VK: Видео, Музыка, Дзен и другие. На каждый из наших сервисов приходится нагрузка порядка 20 000 RPS.

Это важная часть поискового процесса: от неё зависит, насколько быстро человек сформулирует запрос, увидит нужную подсказку и вообще попадёт в правильный сценарий.

Сейчас мы ищем ML-инженера уровня middle–senior, который поможет системно развивать наше направление.

Мы ищем человека, которому интересно экспериментировать и доводить решения до рабочего production-состояния: с понятными метриками, мониторингом, low-latency ограничениями и качественной инженерной эксплуатацией.

Задачи

  • Участвовать в процессе генерации и приоритизации идей, определения направления развития наших сервисов: что имеет смысл делать в первую очередь, где будет заметный эффект
  • Выстроить прозрачные и надёжные процессы вокруг моделей: офлайн-оценку, регулярное переобучение, мониторинг и контроль деградаций
  • Писать production и интеграционный код вокруг моделей, участвовать в выводе решений в прод и их дальнейшей эксплуатации
  • По возможности помогать команде в целом лучше работать с ML: делиться практиками, подходами к оценке качества и здравыми инженерными принципами

Требования

  • Есть опыт коммерческой разработки и внедрения ML-решений в production
  • Понимаете полный жизненный цикл модели: от подготовки данных и обучения до выкладки, мониторинга, переобучения и работы с деградациями
  • Уверенно владеете Python и используете его не только для экспериментов, но и для практической работы с пайплайнами и ML-инструментами
  • Понимаете, как контролировать latency, надёжность и наблюдаемость, откаты, контроль качества
  • Умеете самостоятельно разбираться в уже существующих решениях, замечать риски и предлагать реалистичный план улучшений
  • Готовы работать в связке с backend-разработчиками, аналитиками, ML-специалистами и менеджментом

Будет плюсом

  • Опыт в поиске, саджесте, spell correction, ranking, candidate generation, query understanding или NLP-задачах
  • Опыт с embeddings, retrieval-подходами и задачами понимания запроса
  • Опыт внедрения ML-решений в low-latency сервисы
  • Опыт работы с C++ или желание в него погружаться
  • Опыт работы с YT/YTsaurus
  • Опыт выстраивания MLOps-процессов, мониторинга качества моделей и настройки алертов на деградации
  • Опыт технического аудита ML-систем
  • Умение объяснять ML-подходы простым инженерным языком