Обязанности:
Подключение новых источниковСейчас мы умеем хорошо отвечать по загруженным документам пользователя. Но будем честны: для рабочих задач юзера это не самое привлекательное решение. Мы в своих задачах используем мессенджеры, confluence, Jira или внутренние аналоги и сейчас хотим научиться работать с ними. Вам нужно будет помогать масштабировать архитектуру и подход к решению так, чтобы Алиса могла отвечать по любым большим внешним B2B-базам, особенно по уже имеющимся решениям от Яндекс 360. Улучшение Excel
Все RAG не любят таблицы из-за неочевидного ретрива, сепараторов, переполнения входа числами. Но у нас, как ML-специалистов, в сердце выделено особенное место под Pandas. Пора объединить эти вводные, автоматически решая задачи по таблицам через кодген. Зачем помнить import pandas as pd и эксель, когда можно попросить построить диаграмму AI в чате? Базовое качество
Грубо говоря, все проекты выше — продуктово интересное применение нашей технологии. Но это всё следствие кропотливой и очень важной работы над базовым качеством ответа по документам. Развитие базовой технологии мы не можем остановить ни на секунду. Наш ассистент не всегда хорошо сравнивает спецификации товаров, не способен поставить диагноз вместо врача и может не понимать обозначения резьбы на чертеже. Но какая конкретно модель/технология под капотом стека OCR/VLM/IR/LLM нас подводит? Готовы ли вы это полечить?
Ключевые навыки:
- Обладаете глубокими знаниями в Deep Learning и NLP
- Работали с LLM и пайплайнами вокруг них (function calling, memory, RAG)
- Внедряли ML-системы в продакшен
- Мыслите системно — от архитектуры до интеграции с инфраструктурой
- Пишете на Python, знакомы с PyTorch
- Готовы к кросс-функциональной работе с бэкендом и продуктовыми командами