Мы строим следующее поколение клиентского взаимодействия в экосистеме Сбера: переходим от линейных ботов к адаптивным AI-агентам, которые понимают контекст, планируют действия и решают задачи пользователей автономно. Ищем инженера, который превратит исследовательские гипотезы в работающие, масштабируемые и безопасные LLM-решения.

Обязанности

  • Проектировать и реализовывать end-to-end LLM-пайплайны: RAG (индексация, ретривал, ранжирование, генерация), fine-tuning (SFT, LoRA/QLoRA), промпт-инжиниринг
  • Разрабатывать автономные AI-агенты с планированием, использованием инструментов (tools/function calling) и агентной оркестрацией
  • Строить системы оценки качества: внедрять метрики (RAGAS, DeepEval, кастомные LLM as a judge), проводить A/B-тесты, анализировать пользовательский фидбек
  • Итеративно развивать решение: расширять покрытие сценариев, улучшать качество ответов
  • Переводить бизнес-задачи в технические спецификации, готовить документацию, участвовать в код-ревью.

Требования

  • Уверенное владение Python, опыт работы с ML/NLP стеком: от классических подходов (TF-IDF, BM25) до трансформеров и современных LLM
  • Практический опыт построения LLM-пайплайнов и AI-агентов (LangChain/LangGraph или аналоги), опыт работы с фреймворками для оценки/мониторинга сервисов, использующих LLM (LangSmith, Arize, W&B или аналоги)
  • Понимание архитектуры RAG-систем, работа с векторными базами данных
  • Понимание архитектуры современных LLM: трансформеры (attention, positional encoding, MoE), принципы инференса (KV-cache, batching), токенизация, методы alignment; опыт дообучения LLM (SFT, LoRA)
  • Умение переводить бизнес-требования в технические решения, работать с метриками, проводить эксперименты и обосновывать выбор архитектуры
  • Свободное владение инструментами: Git, SQL, Bash, Docker, опыт работы в Linux-среде

Будет плюсом:

  • Опыт разработки асинхронных и многопоточных сервисов (asyncio, aiohttp, FastAPI)
  • Работа с реляционными и NoSQL базами (PostgreSQL, Redis, ClickHouse), векторными БД (Milvus, Qdrant, Weaviate)
  • Знание принципов LLMOps: CI/CD, контейнеризация, оркестрация, мониторинг в продакшене, управление версиями промптов и данных
  • Опыт работы в финтехе/банковском секторе, понимание требований к безопасности, compliance и обработке персональных данных
  • Публикации, контрибьюшен в open-source по теме AI-агентов и LLM, призовые места в хакатонах.

Условия

  • Комфортный современный офис рядом с м. Кутузовская
  • Формат работы - гибрид после испытательного срока
  • Ежегодный пересмотр зарплаты, годовая премия
  • Корпоративный спортзал и зоны отдыха
  • Более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • Гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
  • Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • Вознаграждение за рекомендацию друзей в команду Сбера.