Ищем Middle / Senior ML Engineer / Researcher в исследовательскую команду для работы над

созданием архитектуры инструктивного редактирования аудио, речи и музыки — от голосовой

конверсии до сложных мультитрековых трансформаций.

Обязанности

  • разработка моделей инструктивного редактирования аудио (“сделай голос ниже”, “убери шум”, “переведи и сохрани тембр”)
  • конверсия голоса, speech-to-speech translation, style & emotion transfer
  • генерация и редактирование музыкальных дорожек: pitch, tempo, timbre, arrangement
  • работа с diffusion / autoregressive аудио-моделями
  • построение универсальных аудио-репрезентаций для разных задач
  • обучение, валидация и масштабирование моделей на больших аудио-корпусах

Требования

  • отличный Python 3, опыт с PyTorch, bash, git, Docker, dvc, HF Transformers
  • хорошее понимание ASR, TTS, DSP ML, speech & audio processing
  • понимание трансформеров, attention-механизмов, KV-cache, diffusion
  • навыки работы с большими датасетами аудио
  • понимание MLOps-практик: мониторинг моделей, дрейф данных, CI/CD
  • умение быстро разбирать и воспроизводить идеи из научных статей

**Будет плюсом:**

  • опыт работы с диффузионными и авторегрессионными архитектурами для аудио/музыки
  • знание мультимодальных LLM / VLM / Audio-LM
  • публикации, open-source вклад или исследовательский опыт в соответствующих областях.

Условия

  • комфортный современный офис - м. Кутузовская
  • ежегодный пересмотр зарплаты, годовой бонус
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера
  • корпоративная пенсионная программа.