В проект по автоматизации бизнеса и развёртыванию локальных LLM (Ollama, vLLM) требуется DevOps-инженер для настройки RAG, векторизации и создания автоматизированных цифровых клонов.
Условия: гибридный формат (офис в Санкт-Петербурге, предпочтительно для настройки железа и доступа к GPU NVIDIA), полная занятость, работа с ИП или самозанятыми, обязательное подписание NDA. Доступ к высокопроизводительному оборудованию (GPU NVIDIA). Оплата поэтапная за внедрённые модули.
Задачи:
- Infrastructure as Code: развертывание и настройка серверов (Ubuntu), оркестрация через Docker/Docker Compose.
- AI & RAG: развёртывание локальных моделей (Ollama, vLLM), настройка векторных БД (Qdrant, Milvus), интеграция моделей для локального обучения и квантования.
- Data Pipeline: настройка пайплайнов для OCR, очистки данных и векторизации.
- Integration: настройка n8n, автоматизация взаимодействия с клиентами (WhatsApp/Telegram) с использованием балансировщиков для обхода блокировок.
- Security: обеспечение сетевой безопасности, настройка VPN/Proxy для доступа к API при ограничениях.
Требования:
- Опыт работы DevOps/System Architect от 3 лет.
- Уверенный стек: Linux (Ubuntu), Docker, Docker Compose, Python.
- Практический опыт с LLM (развёртывание, квантование, RAG) и векторными базами данных.
- Понимание API мессенджеров и методов обхода анти-фрод систем (rate-limiting, имитация активности).