Обязанности:

  • Построение RAG-пайплайнов с использованием векторных БД;
  • разработка API сервисов для интеграции моделей с внутренними системами Банка;
  • оценка качества моделей и мониторинг в проде;
  • деплой модели на локальной инфраструктуре;
  • подготовка и обработка текстовых данных для обучения и дообучения моделей, включая очистку данных, токенизацию и формирование обучающих датасетов.

Требования:

  • Уверенное знание PyTorch, LangChain / LlamaIndex;
  • понимание принципов работы больших языковых моделей (LLM), включая архитектуру, механизмы attention и методы обучения современных языковых моделей;
  • понимание методов дообучения и адаптации языковых моделей, включая fine-tuning, instruction tuning и методы дообучения (LoRA, QLoRA);
  • навыки инференса и оптимизации LLM-моделей, включая управление использованием GPU/CPU, квантование моделей;
  • опыт работы с RAG.

Условия:

  • Работа в офисе в Алматы 5/2 с 9 до 18.

  • Ежеквартальные премии.

  • Корпоративные предложения по фитнесу.

  • Бесплатная подписка на онлайн библитеку «Alpina Digital».

  • Приятная рабочая атмосфера в современном офисе в деловой части города.

  • Возможность строить карьеру в одном из крупнейших банков Казахстана.