Ищем Middle / Senior ML Engineer / Researcher в исследовательскую команду для работы над
созданием архитектуры инструктивного редактирования аудио, речи и музыки — от голосовой
конверсии до сложных мультитрековых трансформаций.
Обязанности
- разработка моделей инструктивного редактирования аудио (“сделай голос ниже”, “убери шум”, “переведи и сохрани тембр”)
- конверсия голоса, speech-to-speech translation, style & emotion transfer
- генерация и редактирование музыкальных дорожек: pitch, tempo, timbre, arrangement
- работа с diffusion / autoregressive аудио-моделями
- построение универсальных аудио-репрезентаций для разных задач
- обучение, валидация и масштабирование моделей на больших аудио-корпусах
Требования
- отличный Python 3, опыт с PyTorch, bash, git, Docker, dvc, HF Transformers
- хорошее понимание ASR, TTS, DSP ML, speech & audio processing
- понимание трансформеров, attention-механизмов, KV-cache, diffusion
- навыки работы с большими датасетами аудио
- понимание MLOps-практик: мониторинг моделей, дрейф данных, CI/CD
- умение быстро разбирать и воспроизводить идеи из научных статей
**Будет плюсом:**
- опыт работы с диффузионными и авторегрессионными архитектурами для аудио/музыки
- знание мультимодальных LLM / VLM / Audio-LM
- публикации, open-source вклад или исследовательский опыт в соответствующих областях.
Условия
- комфортный современный офис - м. Кутузовская
- ежегодный пересмотр зарплаты, годовой бонус
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера
- корпоративная пенсионная программа.

