Обязанности:
-Спроектировать и реализовать RAG‑pipeline с использованием Qdrant, FastAPI и LLM
-Оптимизировать векторный поиск под высокие нагрузки (тюнинг индексов, асинхронная обработка, Kafka‑pipeline)
-Работать с графовыми данными, строить граф знаний и использовать его для улучшения контекста
-Проводить эксперименты по оптимизации эмбеддингов (квантование, fine‑tune) и оценивать качество (Recall@k, MRR, NDCG)
-Интегрировать и поддерживать LLM‑модели в продакшн‑окружении
-Разрабатывать и поддерживать REST‑API на FastAPI

Требования:
-Опыт работы с Python от двух лет
-Глубокое понимание Qdrant, методов оптимизации под нагрузку
-Понимание синтетических чанков
-Опыт работа с графами
-Опыт построения пайплайнов RAG (индексация, ретрив, ранжирование)
-Опыт оптимизации эмбеддингов
-Проекты с интеграцией LLM
-Понимание метрик качества поиска (Recall@k, MRR и др.)
-Опыт работы с брокерами сообщений(желательно Kafka)
-Знание FastAPI

Условия:
-Стабильный и прозрачный доход: размер заработной платы обсуждается по итогам собеседования + квартальная премия по результатам KPI
-Гибкий график работы: вы сможете планировать время так, как удобно вам и вашей команде
-Полную удалёнку или гибрид на выбор, а также уютный ИТ-хаб в Москве, Санкт-Петербурге, Екатеринбурге и сезонный коворкинг в Сочи
-Сложные и интересные задачи, современный стек технологий
-Заботу о вашем здоровье: программа ДМС с первых дней работы, куда входит стоматология, обслуживание в лучших клиниках города, страхование и компенсация 10-ти дней больничного
-Оплату посещения профильных конференций и курсов, помогаем с подготовкой к публичным выступлениям и написанием статей на Хабр
-Доступ к бесплатным корпоративным библиотекам Alpina Digital, MyBook и бизнес-изданий
-Предложения от Банка только для сотрудников: собственные спортзалы (Москва, Санкт-Петербург, Екатеринбург), а также скидки на услуги туристических агентств, продукты питания, в рестораны, бары, магазины

-Спроектировать и реализовать RAG‑pipeline с использованием Qdrant, FastAPI и LLM -Оптимизировать векторный поиск под высокие нагрузки (тюнинг индексов, асинхронная обработка, Kafka‑pipeline) -Работать с графовыми данными, строить граф знаний и использовать его для улучшения контекста -Проводить эксперименты по оптимизации эмбеддингов (квантование, fine‑tune) и оценивать качество (Recall@k, MRR, NDCG) -Интегрировать и поддерживать LLM‑модели в продакшн‑окружении -Разрабатывать и поддерживать REST‑API на FastAPI -Опыт работы с Python от двух лет -Глубокое понимание Qdrant, методов оптимизации под нагрузку -Понимание синтетических чанков -Опыт работа с графами -Опыт построения пайплайнов RAG (индексация, ретрив, ранжирование) -Опыт оптимизации эмбеддингов -Проекты с интеграцией LLM -Понимание метрик качества поиска (Recall@k, MRR и др.) -Опыт работы с брокерами сообщений(желательно Kafka) -Знание FastAPI -Стабильный и прозрачный доход: размер заработной платы обсуждается по итогам собеседования + квартальная премия по результатам KPI -Гибкий график работы: вы сможете планировать время так, как удобно вам и вашей команде -Полную удалёнку или гибрид на выбор, а также уютный ИТ-хаб в Москве, Санкт-Петербурге, Екатеринбурге и сезонный коворкинг в Сочи -Сложные и интересные задачи, современный стек технологий -Заботу о вашем здоровье: программа ДМС с первых дней работы, куда входит стоматология, обслуживание в лучших клиниках города, страхование и компенсация 10-ти дней больничного -Оплату посещения профильных конференций и курсов, помогаем с подготовкой к публичным выступлениям и написанием статей на Хабр -Доступ к бесплатным корпоративным библиотекам Alpina Digital, MyBook и бизнес-изданий -Предложения от Банка только для сотрудников: собственные спортзалы (Москва, Санкт-Петербург, Екатеринбург), а также скидки на услуги туристических агентств, продукты питания, в рестораны, бары, магазины