Обязанности:
Проектировать архитектуру Алисы и разрабатывать рантаймАлиса должна уметь работать как с долгими задачами (десятки минут), так и с быстрыми запросами (сотни миллисекунд), причём единообразно и без лишнего оверхеда.
Алиса должна оставаться надёжной, эффективной и масштабируемой, обрабатывать десятки тысяч RPS.
Алиса работает с разнообразными видами входных данных: файлами, картинками, голосом, текстом.
Рантайм позволяет прокачивать и принимать и систему в целом, и любой компонент (модели, тулы, агенты), траектории пишутся в единых терминах.
Архитектура должна быть прозрачной и понятной.
Больше о бэкенде в Яндексе — в канале Yandex for Backend
Ключевые навыки:
- Умеете проектировать высоконагруженные серверные системы с жёсткими требованиями к latency и стабильности
- Понимаете, как строятся асинхронные пайплайны с большим количеством сетевых вызовов (оркестрация LLM, tool’ов и внешних вызовов)
- Разрабатывали распределённые системы, где важно управление состоянием, потоками данных и отказоустойчивостью
- Готовы писать на C++
Дополнительные требования:
- Работали с Temporal или другой системой оркестрации
- Интересуетесь LLM и представляете, как они работают
