Чем предстоит заниматься:

  • Интеграция LLM в продукты и сервисы (API, backend, пайплайны обработки данных);
  • Оценка качества ответов моделей (автоматические метрики, human eval);
  • Обеспечение безопасности, фильтрации и соответствия этическим требованиям (guardrails);
  • Построение RAG-систем: индексация данных, работа с векторными БД, оптимизация качества поиска и генерации;
  • Взаимодействие с продуктовой и ML-командой, участие в архитектурных решениях;
  • Оптимизация производительности и стоимости инференса (квантизация, batching, caching);
  • Работа с мультимодальными моделями (текст, изображения, документы — при необходимости);
  • Проектирование, обучение и дообучение LLM (fine-tuning, instruction tuning).

Здорово, если у тебя есть:

  • Высшее образование (IT, техническое, математическое);

  • Уверенное владение Python, SQL;

  • Хорошие знания в области теории вероятностей, математической статистики, алгоритмов машинного обучения ML;

  • Знания в области NLP алгоритмов;

  • Понимание деталей работы LLM и того, как происходит их дообучение и инференс;

  • Опыт деплоя ML/LLM решений (Docker, Kubernetes, cloud);

  • Опыт работы с prompt engineering, fine-tuning / PEFT (LoRA, adapters), RAG-подходами;

  • Опыт реализации агентских сценариев;

  • Опыт работы с векторными базами данных: оптимизация индексов, запросов;

  • Опыт с фреймворками: LangChain, LlamaIndex, Hugging Face;

  • Знание методов оценки LLM (BLEU, ROUGE, MMLU, custom evals);

  • Опыт оптимизации инференса (vLLM, TensorRT, ONNX);

  • Опыт работы с мультимодальными моделями;

  • Уверенное владение Python.