О компании и направлении
PSM Unlim развивает направление локальной AI-инфраструктуры и прикладных AI-проектов. Мы создаем контур AI Base / AI Cluster / AI Factory: инженерная база, вычисления, модельный слой, RAG, OCR, AI Gateway, интеграции, ИБ и эксплуатация AI-сервисов в закрытом контуре.
Нам нужен senior-инженер, который станет техническим ядром AI Factory PSM Unlim: поможет спроектировать и собрать локальную AI-платформу, а также будет руководить молодыми специалистами, обучать их и формировать инженерные стандарты направления.
Что нужно делать
- проектировать и развивать backend локальной AI-платформы;
- создавать AI Gateway / Router для маршрутизации запросов;
- развивать Model Registry и управление версиями моделей;
- собирать RAG-контур: ingestion, OCR, parsing, chunking, embeddings, retrieval;
- интегрировать Qdrant / Milvus / аналоги;
- подключать локальные и внешние LLM / VLM;
- проектировать API для AI-сервисов;
- интегрировать AI-контур с 1C / ERP / Bitrix24 / CRM / DMS / Service Desk / MES / SCADA;
- строить мониторинг качества ответов, latency, ошибок, логов и нагрузки;
- участвовать в пилотах с клиентами и технических решениях по AI Cluster / AI Factory.
- формировать внутренние стандарты разработки и эксплуатации AI-платформы: шаблоны сервисов, документация, тестовые наборы, логирование и метрики.
- руководить молодыми специалистами: ставить задачи, проводить code review, обучать RAG / OCR / LLMOps / backend-подходу;
- production backend важнее академического ML;
- опыт RAG и интеграций важнее “пробовал ChatGPT API”;
- опыт локальных моделей, GPU-инференса и закрытых контуров - сильный плюс;
- умение работать с ИБ, DevOps, архитектором и бизнес-заказчиком - обязательно;
- нужен человек, который может быть техническим лидером и наставником команды, а не только исполнителем задач.
- опыт наставничества, code review, постановки задач и обучения junior / middle специалистов - обязательная часть роли.
Стек
Python, FastAPI, Docker, Kubernetes, PostgreSQL, Redis, Kafka / RabbitMQ, Qdrant / Milvus, LangChain / LlamaIndex или собственная RAG-архитектура, vLLM / SGLang / Ollama / TGI как плюс, MLflow / ClearML / DVC как плюс, Prometheus / Grafana, GitLab CI/CD, OCR / parsing, LLM / RAG, GPU-инференс.
Что предлагаем
- наши сотрудники получают исключительно "белую" зарплату: (оклад + премия + годовой бонус). Цифры обсудим с каждым кандидатом индивидуально.
- мы постоянно развиваемся и растем: обучение за счет компании, ТОПовые тренеры и спикеры, участие в семинарах и профессиональных конференциях;
- Локация - удаленно/ офис/ гибрид Москва / СПб / Ярославль / strong remote по РФ
- возможность построить локальную AI-платформу промышленного уровня с нуля;
- роль технического ядра AI Factory PSM Unlim;влияние на архитектуру, стек, команду и продуктовую стратегию;
- возможность сформировать команду AI Platform: обучать молодых специалистов, задавать стандарты и растить будущих инженеров направления;