Команда робототехники занимается всем, что связано с автономными роботами и роботизированными системами: от исследований и прототипирования до разработки первых образцов, интеграции ML-моделей в реальные устройства и подготовки решений к серийному производству. Мы создаём нейросетевые компоненты для роботов: обеспечиваем восприятие, принятие решений, управление поведением, обучение в симуляции и на реальных данных, разрабатываем пайплайны дообучения и инфраструктуру для экспериментов. В команде работают специалисты по machine learning, reinforcement learning, computer vision, vision-language models, MLOps и робототехнике. Сейчас мы ищем RL Lead. Вам предстоит стать техническим лидером в направлении reinforcement learning для автономных гуманоидных и других роботизированных платформ. Мы ищем человека, который умеет соединять исследовательскую глубину, инженерную строгость и продуктовую ответственность: от постановки задач и выбора подходов до внедрения моделей в реальные робототехнические системы.

Обязанности:

Лидерство в команде
Вы будете возглавлять команду RL-разработчиков и отвечать за качество технических решений. В ваши задачи войдут постановка целей, разбиение сложных исследовательских и инженерных задач на части, ревью решений и развитие экспертизы в команде. Важно выстраивать эффективную коммуникацию с VLA-командой и другими командами, синхронизировать планы и помогать превращать исследовательские идеи в работающие решения. Техническое лидерство в RL-домене
Вы будете определять, как применять reinforcement learning в автономных гуманоидных и других роботизированных системах. В зоне ответственности — выбор подходов, архитектур, метрик, исследовательских приоритетов и требований к качеству поведения робота. Важно проектировать решения как часть общей системы обучения и управления роботом, поскольку RL-направление тесно связано с VLA и другими ML-компонентами. Обучение роботов
Вы будете развивать подходы к обучению роботов в симуляции, на синтетических сценариях и на данных с реальных устройств. Особое внимание нужно уделить переносу моделей на физические платформы, устойчивости поведения и работе с редкими и сложными сценариями. Вам предстоит строить воспроизводимые эксперименты и превращать результаты тестов в понятные улучшения моделей. Внедрение SOTA-подходов
Вы будете исследовать и внедрять современные RL-подходы для гуманоидной локомоции, whole-body control, motion tracking и long-horizon-задач. Фокус — на устойчивости поведения, качестве motion tracking, sim-to-real-переносе, ускорении обучения политик и повышении стабильности экспериментов. Вам нужно разбираться в работах уровня SONIC и CLONE, понимать, как их применить к нашим задачам, и превращать лучшие идеи в воспроизводимые эксперименты, пайплайны обучения и работающие решения на роботах. Больше об ML в Яндексе — в канале Yandex for ML

Ключевые навыки:

Управляли командой
Прекрасно ориентируетесь в reinforcement learning, знаете теорию и методы RL, успешно применяли их и добивались практических результатов
Работали с задачами робототехники, локомоции или управления движением
Понимаете специфику обучения в симуляции и переноса моделей на реальные робототехнические платформы
Умеете встраивать ML/RL-решения в реальные системы
Работали с PyTorch
Программируете на Python

Дополнительные требования:

Работали с гуманоидными роботами или другими физическими робототехническими платформами
Знакомы с SOTA-подходами в RL для гуманоидной локомоции, включая работы уровня SONIC, CLONE
Работали с sim-to-real, domain randomization, curriculum learning или imitation learning
Имеете публикации, open-source-проекты или опыт участия в AI/robotics-соревнованиях

Team Lead RL в команду гуманоидных роботов

Job description

Match