- Разработка и поддержка NLP-пайплайнов: суммаризация, коррекция и перевод текста;
- Задачи классификации, генерации и извлечения информации из текстовых данных;
- Работа с мультиязычными датасетами;
- Оптимизация и оценка качества моделей обработки естественного языка;
- Трекинг экспериментов и контроль версий моделей.
Наш стек технологий:
- ЯП: Python=>3.11;
- Фреймворки ML: PyTorch, HuggingFace Transformers;
- Среды для разработки и деплоя: Jupyter, Docker, MLflow, n8n;
- Системы управления версиями: Git, GitLab;
- ОС: Linux.
Что мы ждем от Вас:
- Опыт работы с NLP-задачами: суммаризация, машинный перевод, коррекция текста;
- Опыт файн-тюнинга многоязычных моделей;
- Понимание специфики работы с разными языками;
- Понимание архитектуры Transformer и seq2seq-моделей;
- Понимание ML-метрик качества;
- Проведение исследований и разработка воспроизводимых пайплайнов;
- Знание принципов ООП, SOLID;
-
Знание и применение паттернов проектирования.
Будет плюсом:
- Опыт работы с ASR (Whisper, NeMo и др.);
- Опыт работы с низкоресурсными языками;
- Опыт деплоя моделей: ONNX, Triton, TensorRT.