Обязанности:
Внедрение SOTA-подходовВы будете регулярно изучать новейшие подходы, такие как Wayformer, PlanTF, MotionLM, DriveGPT4, Diffusion Planner, и адаптировать их для продакшн-пригодных решений. Улучшение моделей с помощью RL
Вам предстоит разрабатывать RL-based-пайплайны (PPO, GRPO, DPO), строить reward-модели, собирать датасеты в симуляторе, минимизировать sim-to-real gap. Интерпретируемость моделей
Нужно будет предлагать идеи по разработке инструментов интроспекции моделей — как для отладки сложных случаев, так и для получения технологий промтинга поведения. Больше об ML в Яндексе — в канале Yandex for ML
Ключевые навыки:
- Работали с PyTorch
- Встраивали ML-решения в реальные продукты
- Имеете большой опыт работы с DL, трансформерами, генеративными моделями
Дополнительные требования:
- Разрабатывали и внедряли AV ML-решения, владеете технологиями Imitation и Reinforcement Learning, SLAM, Motion Planning
- Занимались робототехникой (знакомы со словами ROS, Jetson, «сенсорсет»)
- Участвовали в соревнованиях по ML или программированию: ACM ICPC, Codeforces, Topcoder, Kaggle и т. д.
- Умеете писать промышленный код на С++
