В проект по автоматизации бизнеса и развёртыванию локальных LLM (Ollama, vLLM) требуется DevOps-инженер для настройки RAG, векторизации и создания автоматизированных цифровых клонов.

Условия: гибридный формат (офис в Санкт-Петербурге, предпочтительно для настройки железа и доступа к GPU NVIDIA), полная занятость, работа с ИП или самозанятыми, обязательное подписание NDA. Доступ к высокопроизводительному оборудованию (GPU NVIDIA). Оплата поэтапная за внедрённые модули.

Задачи:

Infrastructure as Code: развертывание и настройка серверов (Ubuntu), оркестрация через Docker/Docker Compose.
AI & RAG: развёртывание локальных моделей (Ollama, vLLM), настройка векторных БД (Qdrant, Milvus), интеграция моделей для локального обучения и квантования.
Data Pipeline: настройка пайплайнов для OCR, очистки данных и векторизации.
Integration: настройка n8n, автоматизация взаимодействия с клиентами (WhatsApp/Telegram) с использованием балансировщиков для обхода блокировок.
Security: обеспечение сетевой безопасности, настройка VPN/Proxy для доступа к API при ограничениях.

Требования:

Опыт работы DevOps/System Architect от 3 лет.
Уверенный стек: Linux (Ubuntu), Docker, Docker Compose, Python.
Практический опыт с LLM (развёртывание, квантование, RAG) и векторными базами данных.
Понимание API мессенджеров и методов обхода анти-фрод систем (rate-limiting, имитация активности).

DevOps Engineer

Job description

Match

In line with the market for similar positions