Обязанности:
- Разрабатывать архитектуру и код сложных сервисов с AI-компонентами — real-time, многопользовательские, многоагентные
- Построение масштабируемых AI-пайплайнов: классификация, генерация, маршрутизация
- Интеграция AI-моделей в высоконагруженный бэкенд: очереди, кэширование, асинхронная обработка
- Оптимизация производительности и стоимости LLM-вызовов (latency, throughput)
- Проектирование отказоустойчивых систем с мониторингом и автовосстановлением
- Управление контекстом и состоянием в сложных многоагентных сценариях
- 3+ года разработки серверных систем с практическим опытом асинхронного программирования (asyncio, FastAPI или аналоги)
- Понимание архитектуры распределённых приложений: микросервисы, очереди сообщений, API-шлюзы
- Практический опыт работы с AI / LLM в продакшене — не в теории
- Уверенное владение базами данных (PostgreSQL, Redis, ClickHouse) и умение проектировать схемы под AI-нагрузку
- Опыт с Docker, оркестрацией (Kubernetes) и CI/CD для AI-сервисов
- Опыт с LangChain, LangGraph, Dify или другими фреймворками для построения AI-пайплайнов
- Удалённая работа, полная занятость
- Реальные сложные задачи с высокой нагрузкой и требованиями к надёжности
- Возможность влиять на архитектуру продукта с первого дня
- Зарплата обсуждается индивидуально