Аккредитованная IT-компания «Академия Бизнес Решений» разрабатывает интеллектуального агента, продукт использует передовые AI-технологии.

Технологический стек:

Требования:

Опыт коммерческой разработки в ML/AI от 2 лет.
Глубокое понимание архитектуры RAG (Retrieval-Augmented Generation).
Опыт работы с LLM (Qwen, LLaMA, Gemma или аналоги) — интеграция, дообучение, инференс.
Опыт работы с векторными БД (Qdrant, Milvus, Pinecone или аналоги) — обязательно.
Опыт работы с Embedding-моделями (Qwen-Embedding, Sentence-BERT или аналоги).
Понимание работы Reranker'ов (Qwen-Reranker, Cohere или аналоги).
Опыт работы с распознаванием речи (Whisper) — будет плюсом.
Уверенное владение Python, опыт работы с PyTorch / HuggingFace Transformers.
Навыки оптимизации инференса моделей (vLLM, ONNX, quantization).
Понимание принципов работы с Docker.

Будет плюсом:

Обязанности:

Разработка и улучшение RAG-пайплайна для продукта.
Настройка и дообучение моделей Qwen3.6 для задач составления, проверки и анализа.
Работа с Qdrant для построения семантического поиска.
Интеграция Whisper для голосового ввода данных.
Оптимизация скорости и точности поиска (индексация, кэширование, реранжирование).
Разработка ML-сервисов и их оберток (FastAPI) для интеграции в бэкенд.
Исследование новых AI-подходов и внедрение их в продукт.
Взаимодействие с бэкенд-командой для интеграции ML-компонентов.

Условия:

ML Engineer (LLM, RAG, Qwen, Qdrant)

Job description