Наша команда в управлении экспериментальных систем машинного обучения работает над созданием моделей **Computer Operator** (задачи управления компьютерами, телефонами, браузерами и т.п.). Мы прицельно улучшаем работу моделей в этих задачах, используя **передовые методы обучения (такие как online RL в средах)**, а успешные результаты приземляем в продукты.

Мы ищем AI Engineer, который займется подготовкой и проведением экспериментов с моделями.

Обязанности

  • подготовить сетап эксперимента по **обучению новым RL-методом** (выбрать данные и сформулировать гипотезу, подготовить трейнер/награды и т.д.)
  • построить процесс **rejection sampling** и **стратификации данных** для получения оптимальной сложности обучающих сэмплов на каждой стадии обучения
  • провести серию экспериментов по добавлению данных из других доменов, определить их влияние на качество работы модели в целевых задачах
  • подготовить новый **online-бенчмарк** для замеров наших моделей.

Требования

  • хорошие знания в **python 3.11**, базовых структурах данных и алгоритмах
  • умение **писать эффективный код и отлаживать** его современными инструментами, поддерживать порядок в проекте
  • 2+ года опыта работы с обучением NLP моделей, отличное знание базы по **Deep Learning**, опыт в **Supervised Fine-Tuning** моделей
  • библиотеки **PyTorch, Transformers, vLLM**, опыт обучения моделей на кластерах GPU
  • **git**, опыт работы с Pull/Merge Requests, опыт работы с **s3-like** хранилищами.

Условия

  • комфортный современный офис - м. Кутузовская
  • ежегодный пересмотр зарплаты, годовой бонус
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера
  • корпоративная пенсионная программа.