Нетбелл приглашает ML Engineer для работы над интеграцией LLM в продукты и сервисы.
Обязанности:
- Интегрировать LLM в продукты и сервисы (API, backend, пайплайны обработки данных)
- Разрабатывать и оптимизировать prompt’ы, CoT, системные инструкции
- Оценивать качество ответов (метрики и human eval)
- Настраивать guardrails: безопасность, фильтрация, соответствие требованиям
- Строить RAG-системы: индексация данных, работа с векторными БД, оптимизация поиска и генерации
- Оптимизировать инференс: стоимость, latency, batching, caching, квантизация
- Участвовать в архитектурных решениях с продуктовой и ML-командой
- Исследовать и внедрять новые подходы и модели; при необходимости работать с мультимодальными моделями
Требования:
- Уверенный Python
- Опыт работы с LLM в продакшене
- Понимание prompt engineering, RAG-подходов, оценки качества моделей
- Опыт деплоя ML/LLM решений (Docker, Kubernetes, cloud)
- Опыт работы с векторными базами данных
Будет плюсом:
- Fine-tuning / PEFT (LoRA, adapters)
- RLHF или synthetic data generation
- Опыт с LangChain, LlamaIndex, Hugging Face
- Оптимизация инференса (vLLM, TensorRT, ONNX)
- Опыт с мультимодальными моделями, публикации, open-source, участие в хакатонах
Условия:
- Полная удалёнка
- Аккредитованная ИТ-компания, современный стек, микросервисная архитектура
- Прокачка скиллов под руководством лидов с 8+ лет опыта
- Достойный оклад по итогам собеседования, ежеквартальные бонусы и премии