Ищем Backend / ML Infrastructure / MLOps инженера в проект — ИИ-ассистент по судебной практике РФ (SaaS для юристов). Прототип уже работает: парсинг и индексация документов идут — задача финально собрать продукт.
Стек: Python, TypeScript, Postgres, Qdrant (vector search), embeddings, RAG, reranking (Qwen), self-host LLM-инференс на собственных GPU, S3 (Backblaze B2), Sentry
Что предстоит:
- статистические тулы для профилирования акторов;
- довести до ума инфраструктуру;
- генерация процессуальных документов (иски, жалобы, претензии) с экспортом в .docx/.pdf;
- сборка RAG + reranking в продакшн и стабильный self-host LLM-инференс;
- API, мониторинг и логи качества ответов, обеспечение нагрузочной стабильности.
Требования:
- middle / junior-to-middle специалист;
- уверенный Python (TypeScript — плюс);
- опыт работы с RAG / LLM / vector search / парсингом больших текстовых массивов — большой плюс;
- умение разбираться в существующем коде и доводить фичи до продакшна.
Условия:
- формат работы: удалёнка (офиса нет), работа по РФ, комфортно пересекаться по МСК ±3 ч;
- занятость: проектная, с перспективой перехода в постоянное сотрудничество;
- Зарплатная вилка: от 180 000 до 250 000 ₽/мес (на руки).