Обязанности:
Лидерство в командеВы будете возглавлять команду RL-разработчиков и отвечать за качество технических решений. В ваши задачи войдут постановка целей, разбиение сложных исследовательских и инженерных задач на части, ревью решений и развитие экспертизы в команде. Важно выстраивать эффективную коммуникацию с VLA-командой и другими командами, синхронизировать планы и помогать превращать исследовательские идеи в работающие решения. Техническое лидерство в RL-домене
Вы будете определять, как применять reinforcement learning в автономных гуманоидных и других роботизированных системах. В зоне ответственности — выбор подходов, архитектур, метрик, исследовательских приоритетов и требований к качеству поведения робота. Важно проектировать решения как часть общей системы обучения и управления роботом, поскольку RL-направление тесно связано с VLA и другими ML-компонентами. Обучение роботов
Вы будете развивать подходы к обучению роботов в симуляции, на синтетических сценариях и на данных с реальных устройств. Особое внимание нужно уделить переносу моделей на физические платформы, устойчивости поведения и работе с редкими и сложными сценариями. Вам предстоит строить воспроизводимые эксперименты и превращать результаты тестов в понятные улучшения моделей. Внедрение SOTA-подходов
Вы будете исследовать и внедрять современные RL-подходы для гуманоидной локомоции, whole-body control, motion tracking и long-horizon-задач. Фокус — на устойчивости поведения, качестве motion tracking, sim-to-real-переносе, ускорении обучения политик и повышении стабильности экспериментов. Вам нужно разбираться в работах уровня SONIC и CLONE, понимать, как их применить к нашим задачам, и превращать лучшие идеи в воспроизводимые эксперименты, пайплайны обучения и работающие решения на роботах. Больше об ML в Яндексе — в канале Yandex for ML
Ключевые навыки:
- Управляли командой
- Прекрасно ориентируетесь в reinforcement learning, знаете теорию и методы RL, успешно применяли их и добивались практических результатов
- Работали с задачами робототехники, локомоции или управления движением
- Понимаете специфику обучения в симуляции и переноса моделей на реальные робототехнические платформы
- Умеете встраивать ML/RL-решения в реальные системы
- Работали с PyTorch
- Программируете на Python
Дополнительные требования:
- Работали с гуманоидными роботами или другими физическими робототехническими платформами
- Знакомы с SOTA-подходами в RL для гуманоидной локомоции, включая работы уровня SONIC, CLONE
- Работали с sim-to-real, domain randomization, curriculum learning или imitation learning
- Имеете публикации, open-source-проекты или опыт участия в AI/robotics-соревнованиях