Что делать?
- Разрабатывать и внедрять LLM-решения для задач банка, включая:
- внутренние AI-ассистенты,
- чат-ботов для сотрудников и клиентов,
- поиск и ответы по внутренним документам,
- document intelligence,
- извлечение и структурирование данных из документов,
- Проектировать архитектуру LLM-решений:
- prompt pipeline,
- retrieval / RAG,
- использование knowledge base,
- orchestration логики,
- Разрабатывать evaluation framework для LLM-решений:
- Работать с локальными и внешними LLM-моделями, сравнивать их и выбирать подходящий вариант под задачу.
- Проектировать пайплайны обработки документов и подготовки контекста для LLM.
- Совместно с бизнесом и аналитиками формировать реальные use cases и критерии успеха.
- Участвовать в выборе технологического стека для генеративного AI направления.
- Наставлять других специалистов по вопросам LLM-систем, evaluation и best practices.
Если у вас :
- Опыт работы с AI/LLM/NLP решениями от 3 лет, либо сильный опыт в ML/NLP с существенной практикой по LLM.
- Практический опыт работы с LLM API или локально развернутыми моделями.
- Опыт проектирования LLM applications
- Понимание RAG, embeddings, vector search, reranking, knowledge retrieval.
- Опыт построения evaluation для LLM-систем.
- Понимание ограничений LLM и способов контроля качества.
- Навык проектирования сервисной логики вокруг LLM
Будет плюсом:
- Опыт с локальными LLM-моделями и on-prem inference.
- Опыт с vector DB и knowledge retrieval системами.
- Опыт работы с документными AI-решениями.
- Опыт в банковской сфере, финтехе или в контуре с повышенными требованиями к безопасности.
- Опыт в сравнении open-source и external LLM моделей.
- Опыт настройки quality benchmarks для AI-ассистентов и чат-ботов.
Стек:
- Языки: Python, SQL
- LLM / NLP: OpenAI-compatible APIs, локальные LLM, transformers / sentence-transformers
- RAG и retrieval: embeddings, vector search, reranking
- Vector DB / search: Qdrant
- LLM orchestration: LangChain / custom orchestration pipelines
- API и сервисы: FastAPI, REST API
- MLOps / tracking: MLflow
- Инфраструктура: Docker, Kubernetes, KServe
- Данные и документы: PostgreSQL, object storage, document parsing pipelines
- Мониторинг и evaluation: structured evaluation datasets, logs, quality reports
Что мы предлагаем:
- Официальное трудоустройство в соответствии с Трудовым кодексом РК;
- График работы на выбор: 08:30–17:30 / 09:00–18:00 / 09:30–18:30;
- Ежегодный оплачиваемый отпуск — 28 календарных дней;
После прохождения испытательного срока:
- Кафетерий льгот на сумму 250 000 тг. в год (медицинское страхование, обучение, спорт, развитие детей, авиа- и ж/д билеты);
- 2 дополнительных дня Day Off в год;
Дополнительно:
- Лечебное пособие в размере одного оклада при выходе в отпуск (после 1 года работы, при отпуске от 14 дней).