Наша команда в управлении экспериментальных систем машинного обучения работает над созданием моделей **Computer Operator** (задачи управления компьютерами, телефонами, браузерами и т.п.). Мы прицельно улучшаем работу моделей в этих задачах, используя **передовые методы обучения (такие как online RL в средах)**, а успешные результаты приземляем в продукты.
Мы ищем AI Engineer, который займется подготовкой и проведением экспериментов с моделями.
Обязанности
- подготовить сетап эксперимента по **обучению новым RL-методом** (выбрать данные и сформулировать гипотезу, подготовить трейнер/награды и т.д.)
- построить процесс **rejection sampling** и **стратификации данных** для получения оптимальной сложности обучающих сэмплов на каждой стадии обучения
- провести серию экспериментов по добавлению данных из других доменов, определить их влияние на качество работы модели в целевых задачах
- подготовить новый **online-бенчмарк** для замеров наших моделей.
Требования
- хорошие знания в **python 3.11**, базовых структурах данных и алгоритмах
- умение **писать эффективный код и отлаживать** его современными инструментами, поддерживать порядок в проекте
- 2+ года опыта работы с обучением NLP моделей, отличное знание базы по **Deep Learning**, опыт в **Supervised Fine-Tuning** моделей
- библиотеки **PyTorch, Transformers, vLLM**, опыт обучения моделей на кластерах GPU
- **git**, опыт работы с Pull/Merge Requests, опыт работы с **s3-like** хранилищами.
Условия
- комфортный современный офис - м. Кутузовская
- ежегодный пересмотр зарплаты, годовой бонус
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера
- корпоративная пенсионная программа.
