О компании и направлении

PSM Unlim развивает направление локальной AI-инфраструктуры и прикладных AI-проектов. Мы создаем контур AI Base / AI Cluster / AI Factory: инженерная база, вычисления, модельный слой, RAG, OCR, AI Gateway, интеграции, ИБ и эксплуатация AI-сервисов в закрытом контуре.

Нам нужен senior-инженер, который станет техническим ядром AI Factory PSM Unlim: поможет спроектировать и собрать локальную AI-платформу, а также будет руководить молодыми специалистами, обучать их и формировать инженерные стандарты направления.

Что нужно делать

  • проектировать и развивать backend локальной AI-платформы;
  • создавать AI Gateway / Router для маршрутизации запросов;
  • развивать Model Registry и управление версиями моделей;
  • собирать RAG-контур: ingestion, OCR, parsing, chunking, embeddings, retrieval;
  • интегрировать Qdrant / Milvus / аналоги;
  • подключать локальные и внешние LLM / VLM;
  • проектировать API для AI-сервисов;
  • интегрировать AI-контур с 1C / ERP / Bitrix24 / CRM / DMS / Service Desk / MES / SCADA;
  • строить мониторинг качества ответов, latency, ошибок, логов и нагрузки;
  • участвовать в пилотах с клиентами и технических решениях по AI Cluster / AI Factory.
  • формировать внутренние стандарты разработки и эксплуатации AI-платформы: шаблоны сервисов, документация, тестовые наборы, логирование и метрики.
  • руководить молодыми специалистами: ставить задачи, проводить code review, обучать RAG / OCR / LLMOps / backend-подходу;
  • production backend важнее академического ML;
  • опыт RAG и интеграций важнее “пробовал ChatGPT API”;
  • опыт локальных моделей, GPU-инференса и закрытых контуров - сильный плюс;
  • умение работать с ИБ, DevOps, архитектором и бизнес-заказчиком - обязательно;
  • нужен человек, который может быть техническим лидером и наставником команды, а не только исполнителем задач.
  • опыт наставничества, code review, постановки задач и обучения junior / middle специалистов - обязательная часть роли.

Стек

Python, FastAPI, Docker, Kubernetes, PostgreSQL, Redis, Kafka / RabbitMQ, Qdrant / Milvus, LangChain / LlamaIndex или собственная RAG-архитектура, vLLM / SGLang / Ollama / TGI как плюс, MLflow / ClearML / DVC как плюс, Prometheus / Grafana, GitLab CI/CD, OCR / parsing, LLM / RAG, GPU-инференс.

Что предлагаем

  • наши сотрудники получают исключительно "белую" зарплату: (оклад + премия + годовой бонус). Цифры обсудим с каждым кандидатом индивидуально.
  • мы постоянно развиваемся и растем: обучение за счет компании, ТОПовые тренеры и спикеры, участие в семинарах и профессиональных конференциях;
  • Локация - удаленно/ офис/ гибрид Москва / СПб / Ярославль / strong remote по РФ
  • возможность построить локальную AI-платформу промышленного уровня с нуля;
  • роль технического ядра AI Factory PSM Unlim;влияние на архитектуру, стек, команду и продуктовую стратегию;
  • возможность сформировать команду AI Platform: обучать молодых специалистов, задавать стандарты и растить будущих инженеров направления;