Мы ищем руководителя направления обучения больших языковых моделей, который будет отвечать за развитие качества моделей в доменной области через системное управление обучением, данными и оценкой.

Роль предполагает работу на стыке исследований, инженерии и продуктовых задач с фокусом на практическое применение моделей в бизнесе.

Обязанности

**1\. Развитие качества моделей**

  • анализ современных методов обучения LLM (SFT, RLHF/DPO, synthetic data, дистилляция)
  • формирование стратегии обучения моделей под бизнес-задачи
  • определение необходимых навыков модели (skills decomposition)

**2\. Работа с данными**

  • проектирование и развитие пайплайна датасетов:
  • сбор, очистка, разметка, валидация
  • создание обучающих и тестовых выборок
  • разработка синтетических датасетов

**3\. Бенчмарки и оценка**

  • разработка и поддержка системы оценки качества моделей
  • создание бенчмарков (включая domain-specific)
  • проведение регулярного тестирования и сравнительного анализа моделей
  • контроль регресса

**4\. Управление командой**

  • руководство командой разметки (до 40 человек) и подготовки данных (4 человека)
  • постановка задач, контроль качества разметки
  • разработка методологии разметки и инструкций
  • работа с инструментами разметки (например, TagMe)

**5\. Взаимодействие с рисками и compliance**

  • согласование подходов к обучению с управлением модельных рисков
  • контроль аспектов: галлюцинации, bias, соответствие нормативным требованиям
  • обеспечение прозрачности и воспроизводимости обучения

**6\. Интеграция с продуктом**

  • работа с продуктовыми командами (LLM-агенты, RAG-системы)
  • приоритизация задач обучения на основе бизнес-метрик
  • участие в запуске моделей в прод

**7\. Экономика и эффективность**

  • оценка эффективности обучения (качество vs стоимость)
  • выбор оптимальных стратегий: дообучение vs архитектурные изменения
  • оптимизация использования вычислительных ресурсов

Требования

  • опыт работы с LLM / NLP от 3–5 лет
  • практический опыт обучения моделей (SFT, RLHF/DPO или аналоги)
  • опыт построения датасетов и evaluation pipelines
  • понимание архитектуры LLM и принципов их обучения
  • опыт управления командой
  • уверенное владение Python и ML-стеком (PyTorch / HuggingFace)

![](//:0)

**Будет плюсом**

  • опыт работы с доменными моделями (например, legal, finance)
  • опыт построения пайплайнов генерации синтетических данных
  • опыт внедрения моделей в прод
  • знание подходов к снижению галлюцинаций

Условия

  • участие в развитии одного из ключевых направлений AI
  • влияние на качество и поведение моделей в проде
  • работу на стыке исследований и реальных бизнес-задач
  • возможность выстраивать процессы обучения моделей с нуля с командами претрейна и обучения