19 hours ago

NLP Engineer в Computer Operator (RnD)

Onsite

г Москва

AI EngineerDeep LearningAmazon S3GPUNatural Language ProcessingPyTorchreinforcement learningrequestsTransformer ArchitecturevLLMPython 3NLP EngineerFine-tuning

Job description

Наша команда в управлении экспериментальных систем машинного обучения работает над созданием моделей **Computer Operator** (задачи управления компьютерами, телефонами, браузерами и т.п.). Мы прицельно улучшаем работу моделей в этих задачах, используя **передовые методы обучения (такие как online RL в средах)**, а успешные результаты приземляем в продукты.

Мы ищем AI Engineer, который займется подготовкой и проведением экспериментов с моделями.

Обязанности

подготовить сетап эксперимента по **обучению новым RL-методом** (выбрать данные и сформулировать гипотезу, подготовить трейнер/награды и т.д.)
построить процесс **rejection sampling** и **стратификации данных** для получения оптимальной сложности обучающих сэмплов на каждой стадии обучения
провести серию экспериментов по добавлению данных из других доменов, определить их влияние на качество работы модели в целевых задачах
подготовить новый **online-бенчмарк** для замеров наших моделей.

Требования

хорошие знания в **python 3.11**, базовых структурах данных и алгоритмах
умение **писать эффективный код и отлаживать** его современными инструментами, поддерживать порядок в проекте
2+ года опыта работы с обучением NLP моделей, отличное знание базы по **Deep Learning**, опыт в **Supervised Fine-Tuning** моделей
библиотеки **PyTorch, Transformers, vLLM**, опыт обучения моделей на кластерах GPU
**git**, опыт работы с Pull/Merge Requests, опыт работы с **s3-like** хранилищами.

Условия

комфортный современный офис - м. Кутузовская
ежегодный пересмотр зарплаты, годовой бонус
корпоративный спортзал и зоны отдыха
более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
вознаграждение за рекомендацию друзей в команду Сбера
корпоративная пенсионная программа.

Good match

We match every vacancy against your profile and show a fit score — so you instantly know which ones are worth applying to. Sign up and create a resume — it's free.

Not enough data to estimate a salary range for this role in this region yet.