Ищем Backend / ML Infrastructure / MLOps инженера в проект — ИИ-ассистент по судебной практике РФ (SaaS для юристов). Прототип уже работает: парсинг и индексация документов идут — задача финально собрать продукт.

Стек: Python, TypeScript, Postgres, Qdrant (vector search), embeddings, RAG, reranking (Qwen), self-host LLM-инференс на собственных GPU, S3 (Backblaze B2), Sentry

Что предстоит:

  • статистические тулы для профилирования акторов;
  • довести до ума инфраструктуру;
  • генерация процессуальных документов (иски, жалобы, претензии) с экспортом в .docx/.pdf;
  • сборка RAG + reranking в продакшн и стабильный self-host LLM-инференс;
  • API, мониторинг и логи качества ответов, обеспечение нагрузочной стабильности.

Требования:

  • middle / junior-to-middle специалист;
  • уверенный Python (TypeScript — плюс);
  • опыт работы с RAG / LLM / vector search / парсингом больших текстовых массивов — большой плюс;
  • умение разбираться в существующем коде и доводить фичи до продакшна.

Условия:

  • формат работы: удалёнка (офиса нет), работа по РФ, комфортно пересекаться по МСК ±3 ч;
  • занятость: проектная, с перспективой перехода в постоянное сотрудничество;
  • Зарплатная вилка: от 180 000 до 250 000 ₽/мес (на руки).