Ищем Backend / ML Infrastructure / MLOps инженера в проект — ИИ-ассистент по судебной практике РФ (SaaS для юристов). Прототип уже работает, парсинг и индексация идут — задача финально собрать продукт.

Формат работы: удалёнка, города по РФ, комфортно пересекаться по МСК ±3 ч.

Занятость: проектная с перспективой перехода в постоянное сотрудничество.

Стек: Python, TypeScript, Postgres, Qdrant (vector search), embeddings, RAG, reranking (Qwen), self-host LLM-инференс на собственных GPU, S3 (Backblaze B2), Sentry.

Что предстоит делать:

  • статистические тулы для профилирования акторов;
  • довести до ума инфраструктуру;
  • генерация процессуальных документов (иски, жалобы, претензии) с экспортом в .docx/.pdf;
  • сборка RAG + reranking в продакшн и стабильный self-host LLM-инференс;
  • API, мониторинг и логи качества ответов, обеспечение нагрузочной стабильности.

Требования: middle / junior-to-middle; уверенный Python (TypeScript — плюс); умение разобраться в существующем коде и доводить фичи до прода. Опыт с RAG / LLM / vector search / парсинг больших текстовых массивов — большой плюс.