О нас: Мы — Gorgona AI, ведущая инфраструктурная платформа для создания безопасных автономных ИИ-агентов. Мы не занимаемся перепродажей чужих API-ключей. Мы — полноценный enterprise-вендор: строим решения класса On-Premise, которые внедряются в закрытые контуры крупного бизнеса и госсектора (GovTech) по принципу Zero Trust. Наша миссия — дать корпорациям всю мощь генеративного ИИ без риска утечки конфиденциальных данных.
Кого мы ищем: Опытного ML-инженера для реализации задач наших клиентов.
Стек технологий: Python 3.12+, asyncio, FastAPI, Uvicorn, Pydantic v2, LiteLLM, vLLM, TGI, Ollama, LangChain, LlamaIndex, Qdrant, Chroma, Pinecone, Sentence-Transformers, OpenAI Embeddings, Unstructured, Chonkie, LangChain Text Splitters, FlashRank, Cohere, Presidio, NeMo Guardrails, Detoxify, OpenLLMetry, LangFuse, LangSmith, Prometheus, Docker, Kubernetes, CUDA, GPU, A10, A100, MinIO.
Чем предстоит заниматься?
-
Разрабатывать LLM routing и gateway слой;
-
Реализовывать и оптимизировать RAG-пайплайны;
-
Встраивать guardrails и AI safety механизмы;
-
Интегрировать LLM observability и трейсинг;
-
Оптимизировать inference по latency, throughput и стоимости;
-
Реализовывать evaluation-пайплайны качества ответов;
-
Работать с GPU-инфраструктурой и масштабированием.
Мы ожидаем:
-
Опыт работы ML-инженером от 5 лет;
-
Реальный опыт вывода ML-моделей в production и понимание жизненного цикла модели;
-
Глубокое понимание RAG-архитектур: практические навыки работы с векторными БД (Qdrant, Milvus, Weaviate, PGVector) и фреймворками (LangChain, LlamaIndex или кастомные решения);
-
Глубокое знание Python и async-стека;
-
Умение проектировать и оценивать эксперименты, работать с метриками;
-
Продуктовый опыт работы с LLM;
-
Понимание рисков и безопасности LLM-систем.
Будет плюсом:
-
Agentic RAG и multi-agent системы;
-
Fine-tuning моделей (LoRA, QLoRA);
-
Multi-modal модели (vision, audio);
-
ASR, TTS, OCR, NER;
-
Опыт evaluation-фреймворков (RAGAS, deepeval);
-
Оптимизация inference (batching, KV-cache, quantization).
Что мы предлагаем:
- Конкурентная заработная плата (обсуждается по итогам собеседования).
- Современный офис в Ташкенте.
- Отсутствие микроменеджмента: нам важен результат, качество контента и рост вовлеченности нашей целевой аудитории.