В проект по автоматизации бизнеса и развёртыванию локальных LLM (Ollama, vLLM) требуется DevOps-инженер для настройки RAG, векторизации и создания автоматизированных цифровых клонов.

Условия: гибридный формат (офис в Санкт-Петербурге, предпочтительно для настройки железа и доступа к GPU NVIDIA), полная занятость, работа с ИП или самозанятыми, обязательное подписание NDA. Доступ к высокопроизводительному оборудованию (GPU NVIDIA). Оплата поэтапная за внедрённые модули.

Задачи:

  • Infrastructure as Code: развертывание и настройка серверов (Ubuntu), оркестрация через Docker/Docker Compose.
  • AI & RAG: развёртывание локальных моделей (Ollama, vLLM), настройка векторных БД (Qdrant, Milvus), интеграция моделей для локального обучения и квантования.
  • Data Pipeline: настройка пайплайнов для OCR, очистки данных и векторизации.
  • Integration: настройка n8n, автоматизация взаимодействия с клиентами (WhatsApp/Telegram) с использованием балансировщиков для обхода блокировок.
  • Security: обеспечение сетевой безопасности, настройка VPN/Proxy для доступа к API при ограничениях.

Требования:

  • Опыт работы DevOps/System Architect от 3 лет.
  • Уверенный стек: Linux (Ubuntu), Docker, Docker Compose, Python.
  • Практический опыт с LLM (развёртывание, квантование, RAG) и векторными базами данных.
  • Понимание API мессенджеров и методов обхода анти-фрод систем (rate-limiting, имитация активности).