Требуется data scientist в команду, комбинирующую применение бизнес-логики, классических моделей, NLP и LLM.

Основные задачи команды:

  • Проведение исследований, проверка гипотез команды с использованием LLM.
  • Совершенствование LLM моделей, используя промт-инжиниринг. Векторизация документов (для RAG сервиса).
  • Преобразование изображения текста в машиночитаемый формат (OCR).
  • Разработка и внедрение моделей(NLP\классический ML\графовые сети) в промышленные системы.
  • Поиск и обработка данных, создание эмбеддингов, внедрение в текущие процессы.

Требования:

  • Высшее математическое/техническое образование
  • Понимание принципов обработки естественных языков на python
  • Понимание принципов обработки изображений на python
  • Понимание принципов работы с большими языковыми моделями
  • Уверенное знание математики, статистики и машинного обучения;
  • Владение Python и опыт практического применения алгоритмов машинного обучения: нейронные сети, композиционные алгоритмы, NLP.

Будет плюсом:

  • Уверенное владение SQL (оконные функции, регулярные выражения)
  • Опыт работы с Hadoop(HDFS, Hive/Impala), Spark.
  • Опыт работы с нейронными сетями на последовательностях.
  • Опыт работы с изображениями (opencv, PIL).