Наша команда разрабатывает и поддерживает инфраструктуру для генеративных сетей и бизнес-логики в ключевом продукте Яндекса — Алиса в Поиске. В нём реализованы две связанные технологии. Быстрые ответы, которые собирают ключевую информацию прямо на странице выдачи, и Алиса AI — самая мощная нейросеть Яндекса для длинных и сложных запросов в отдельном чате. С помощью Алисы мы строим гибридный поиск, где классические механики и ассистентский опыт бесшовно дополняют друг друга. Мы объединили LLM и Поиск Яндекса в Alice AI Search — умную и в то же время лёгкую модель, генерирующую миллионы ответов для пользователей. Создали мультимодальный поиск, который понимает и обрабатывает информацию почти как человек. Ориентируясь на пользовательские сценарии, мы дообучаем наши модели с помощью supervised fine-tuning и RL, а затем интегрируем разработки в другие продукты Яндекса. Это сложные, уникальные, трудновоспроизводимые технологии; их развитие — то, что нас драйвит. Мы ищем опытного коллегу, который будет выполнять задачи на стыке продуктовой разработки, ML и инфраструктуры. Вы будете реализовывать бизнес-логику и участвовать в сборке конфигураций релиз-кандидатов.

Обязанности:

Создание генеративных пайплайнов
Вам предстоит брать на себя ключевые технические вызовы: проектировать рантайм-пайплайны, интегрировать передовые ML-модели, реализовывать бизнес-логику, обеспечивать согласованность технических решений с требованиями продуктовой и ML-команды. Интеграция ML-моделей и сервисов
Вы будете реализовывать механизмы встраивания обученных моделей в прод, поднимать генеративные модели в существующей инфраструктуре, интегрировать их в генеративные пайплайны (C++, Jinja), а также внедрять технологии Алисы AI в Поиск. Поддержка и оптимизация решений
Вам предстоит обеспечивать стабильность продуктовой логики в проде, настраивать мониторинг метрик продукта, быстро выявлять и устранять проблемы, улучшать бизнес-логику и инфраструктуру, чтобы повышать достоверность быстрых ответов. Настройка и оптимизация инфраструктуры
Вы будете оптимизировать конфигурацию сервисов под нагрузку и требования продуктовой команды, настраивать механизмы масштабирования и отказоустойчивости, дорабатывать инфраструктурные компоненты. Больше о бэкенде в Яндексе — в канале Yandex for Backend

Ключевые навыки:

  • Разбираетесь в базовых алгоритмах и структурах данных
  • Хорошо знаете С++
  • Знакомы с паттернами и идиомами построения программного обеспечения
  • Умеете писать надёжный и читабельный многопоточный код