Обязанности
Твоя роль — проектирование устойчивых и масштабируемых AI-систем.
-
AI Architecture: проектировать Agent Orchestrator, RAG-архитектуры и многошаговые AI-потоки (multi-step flows).
-
LLM & Model Layer: работать с несколькими LLM, настраивать Model Router и оптимизировать стоимость, задержку (latency) и использование токенов.
-
Performance & Scaling: оптимизировать работу GPU, пропускную способность (throughput) и настраивать автоскейлинг для high-load сценариев.
-
Safety & Observability: внедрять механизмы защиты от галлюцинаций и промпт-инъекций, настраивать AI-tracing и мониторинг поведения агентов.
- Mentorship: проводить Code review и помогать Middle-инженерам с архитектурными решениями.
Требования
-
Бэкграунд: ты в первую очередь отличный Python-разработчик (Production-level, FastAPI, Async) с опытом работы от 2 лет и выше.
-
Экспертиза в ИИ: глубокое понимание LLM, RAG (embedding pipelines, vector DB) и архитектуры ИИ-агентов.
-
Инструментарий: опыт работы с LangChain, Haystack или LlamaIndex, а также с векторными БД (Milvus, Pinecone и др.).
-
Системный подход: понимание принципов работы распределенных систем (K8s, Kafka) и API design (REST/gRPC).
- Безопасность: знание базовых вопросов безопасности и надежности при разработке ИИ-агентов (fallback, retry logic, circuit breakers).
Условия
- People Based культура: для нас люди — главная ценность, мы строим среду доверия и поддержки.
- Прозрачность: полностью «белое» оформление, работа строго по закону.
- Отпуск: 28 календарных дней в году для перезагрузки.
- Wellness: предоставляем 150 000 ₸ в год в качестве бюджета на спорт и здоровье.
- Влияние: ты будешь напрямую влиять на roadmap всей AI-платформы и принимать ключевые архитектурные решения.