Наша команда учит YandexGPT работать с внешней информацией (RAG), источниками которой могут выступать Яндекс Поиск или специализированные базы знаний (например, тексты документации). Такой подход максимально расширяет возможности современных LLM: уменьшает галлюцинации, улучшает фактологичность, не ограничивает знания модели теми данными, которые она уже видела.

Обязанности:

Обучение больших языковых моделей
Учить LLM работать с внешней информацией из различных доменов, извлекать из неструктурированных текстов информацию, полезную для ответа на запрос пользователя. Проверять и внедрять самые современные подходы из научных статей. Поиск релевантных документов
Исследовать и комбинировать различные подходы для поиска релевантных документов. Формировать базы знаний с полезными для конкретной задачи документами. Внедрение в продукты
Создавать инструменты для внедрения технологии как внутри Яндекса, так и вовне. Подробнее про Alice AI Больше об ML в Яндексе — в канале Yandex for ML

Ключевые навыки:

  • Отлично знаете классические ML и NLP
  • Понимаете, как устроены современные LLM, решали с их помощью прикладные задачи или имеете релевантный исследовательский опыт
  • Следите за трендами в области LLM. Можете бегло прочитать статью и быстро понять основную идею

Дополнительные требования:

  • Строили RAG-пайплайны
  • Занимались информационным поиском