Чем предстоит заниматься:
  • Разработка и поддержка NLP-пайплайнов: суммаризация, коррекция и перевод текста;
  • Задачи классификации, генерации и извлечения информации из текстовых данных;
  • Работа с мультиязычными датасетами;
  • Оптимизация и оценка качества моделей обработки естественного языка;
  • Трекинг экспериментов и контроль версий моделей.

Наш стек технологий:

  • ЯП: Python=>3.11;
  • Фреймворки ML: PyTorch, HuggingFace Transformers;
  • Среды для разработки и деплоя: Jupyter, Docker, MLflow, n8n;
  • Системы управления версиями: Git, GitLab;
  • ОС: Linux.

Что мы ждем от Вас:

  • Опыт работы с NLP-задачами: суммаризация, машинный перевод, коррекция текста;
  • Опыт файн-тюнинга многоязычных моделей;
  • Понимание специфики работы с разными языками;
  • Понимание архитектуры Transformer и seq2seq-моделей;
  • Понимание ML-метрик качества;
  • Проведение исследований и разработка воспроизводимых пайплайнов;
  • Знание принципов ООП, SOLID;
  • Знание и применение паттернов проектирования.

Будет плюсом:

  • Опыт работы с ASR (Whisper, NeMo и др.);
  • Опыт работы с низкоресурсными языками;
  • Опыт деплоя моделей: ONNX, Triton, TensorRT.