Аккредитованная IT-компания «Академия Бизнес Решений» разрабатывает интеллектуального агента, продукт использует передовые AI-технологии.
Технологический стек:
-
AI стек: Qwen3.6-35B-A3B, Qwen3-Embedding-4B-Q4_K_M, Whisper
-
Backend (для ML): Python 3, FastAPI (для обертки моделей), Docker
-
Инструменты: HuggingFace, PyTorch
Требования:
-
Опыт коммерческой разработки в ML/AI от 2 лет.
-
Глубокое понимание архитектуры RAG (Retrieval-Augmented Generation).
-
Опыт работы с LLM (Qwen, LLaMA, Gemma или аналоги) — интеграция, дообучение, инференс.
-
Опыт работы с векторными БД (Qdrant, Milvus, Pinecone или аналоги) — обязательно.
-
Опыт работы с Embedding-моделями (Qwen-Embedding, Sentence-BERT или аналоги).
-
Понимание работы Reranker'ов (Qwen-Reranker, Cohere или аналоги).
-
Опыт работы с распознаванием речи (Whisper) — будет плюсом.
-
Уверенное владение Python, опыт работы с PyTorch / HuggingFace Transformers.
-
Навыки оптимизации инференса моделей (vLLM, ONNX, quantization).
-
Понимание принципов работы с Docker.
Будет плюсом:
-
Опыт дообучения LLM под задачи (fine-tuning, LoRA, QLoRA).
-
Опыт работы с Prometheus / Grafana для мониторинга ML-сервисов.
-
Публикации или open-source проекты в области NLP.
Обязанности:
-
Разработка и улучшение RAG-пайплайна для продукта.
-
Настройка и дообучение моделей Qwen3.6 для задач составления, проверки и анализа.
-
Работа с Qdrant для построения семантического поиска.
-
Интеграция Whisper для голосового ввода данных.
-
Оптимизация скорости и точности поиска (индексация, кэширование, реранжирование).
-
Разработка ML-сервисов и их оберток (FastAPI) для интеграции в бэкенд.
-
Исследование новых AI-подходов и внедрение их в продукт.
-
Взаимодействие с бэкенд-командой для интеграции ML-компонентов.
Условия:
- Аккредитованная IT-компания.
- Зарплата: ежемесячная зп+ годовая премия (на руки, по итогам собеседования).
- Работа в офисе в г. Пермь (полный день, 5/2).
- Работа над высоконагруженным продуктом.
- Возможность профессионального роста до Tech Lead.