Нетбелл приглашает ML Engineer для работы над интеграцией LLM в продукты и сервисы.

Обязанности:

  • Интегрировать LLM в продукты и сервисы (API, backend, пайплайны обработки данных)
  • Разрабатывать и оптимизировать prompt’ы, CoT, системные инструкции
  • Оценивать качество ответов (метрики и human eval)
  • Настраивать guardrails: безопасность, фильтрация, соответствие требованиям
  • Строить RAG-системы: индексация данных, работа с векторными БД, оптимизация поиска и генерации
  • Оптимизировать инференс: стоимость, latency, batching, caching, квантизация
  • Участвовать в архитектурных решениях с продуктовой и ML-командой
  • Исследовать и внедрять новые подходы и модели; при необходимости работать с мультимодальными моделями

Требования:

  • Уверенный Python
  • Опыт работы с LLM в продакшене
  • Понимание prompt engineering, RAG-подходов, оценки качества моделей
  • Опыт деплоя ML/LLM решений (Docker, Kubernetes, cloud)
  • Опыт работы с векторными базами данных

Будет плюсом:

  • Fine-tuning / PEFT (LoRA, adapters)
  • RLHF или synthetic data generation
  • Опыт с LangChain, LlamaIndex, Hugging Face
  • Оптимизация инференса (vLLM, TensorRT, ONNX)
  • Опыт с мультимодальными моделями, публикации, open-source, участие в хакатонах

Условия:

  • Полная удалёнка
  • Аккредитованная ИТ-компания, современный стек, микросервисная архитектура
  • Прокачка скиллов под руководством лидов с 8+ лет опыта
  • Достойный оклад по итогам собеседования, ежеквартальные бонусы и премии