Мы - команда ML-инженеров GigaChat Data.

Наша команда готовит данные для обучения всей линейки моделей LLM GigaChat (GigaChat, GigaChat Vision, GigaChat Audio, Giga Embeddings и др.). Мы собираем данные как для базовых моделей, так и для их адаптации под конкретные сценарии:

  • Core модели – базовые модели
  • продукты B2C – WEB-версия GigaChat, персонализированные интеллектуальные ассистенты
  • внутренние банковские задачи – автоматизация обработки документов, анализ финансовых данных, поддержка сотрудников
  • внешние заказчики – кастомные решения для корпоративных клиентов, интеграция LLM в бизнес-процессы.

_Первый этап отбора на эту вакансию – общение с AI-рекрутером. После отклика вам на почту и в чат на платформе HeadHunter придет приглашение пройти первичное интервью с ГигаРекрутером в Telegram. Диалог займёт примерно 10 минут. Его задача — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры._

_ГигаРекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным!_

Обязанности

### Задачи:

  • сбор данных для alignment обучения моделей: Supervised Finetuning (SFT), Reinforcement Learning (RL, DPO , PPO, GRPO)
  • улучшение пайплайнов предобработки данных для разметки и обучения
  • работа в плотной связке с командой ML, LoRA-finetuning
  • взаимодействие с командой асессоров/ разметчиков (мониторинг качества, корректировка инструкций)
  • расчет метрик и принятие решений по улучшению качества данных на их основе.

Требования

### Для нас важно:

  • знания Python на очень высоком уровне
  • опыт работы с проприетарными и open-source LLM (Llama, Mistral, Qwen, Google Gemini, OpenAI GPT, Anthropic и др.)
  • понимание процессов работы с данными для больших языковых моделей
  • способность решать проблемы и организовывать работу в условиях многозадачности.

Будет плюсом:

  • опыт работы с LLM-агентами (LangChain, LangSmith, LangGraph, FAISS, RAG, ChromaDB и пр.).

Условия

### Мы предлагаем:

  • крупнейшее DS&AI community — более 600 DS-специалистов банка
  • дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира
  • возможность выбрать удобный формат работы: гибрид или офис
  • комфортный современный офис: ст. м. Кутузовская, пр. Кутузовский, 32
  • ежегодный пересмотр зарплаты, годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • ипотека выгоднее до 7% для каждого сотрудника
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера.