Алиса Про — B2B-сервис-побратим всем известного AI-ассистента, который интегрирует лучшее из Алисы AI в рабочие процессы: позволяет искать и анализировать данные, создавать контент, подключать корпоративные системы. Мы нацелены на то, чтобы стать ведущим игроком на рынке, предоставляя компаниям комплексное решение для цифровизации рабочих процессов. В фокусе — внедрение on-premise- и облачных решений для корпоративных заказчиков: система работает с десятками тысяч документов и встраивается в существующую ИТ-инфраструктуру. Наша команда обеспечивает высокое качество продукта благодаря передовым NLP-технологиям. Среди ключевых направлений: * парсинг документов с помощью OCR/VLM; * эффективные мультимодальные RAG-реализации; * исследования в области ризонинга, работы с длинным контекстом и разработки AI-агентов.

Обязанности:

Подключение новых источников
Сейчас мы умеем хорошо отвечать по загруженным документам пользователя. Но будем честны: для рабочих задач юзера это не самое привлекательное решение. Мы в своих задачах используем мессенджеры, confluence, Jira или внутренние аналоги и сейчас хотим научиться работать с ними. Вам нужно будет помогать масштабировать архитектуру и подход к решению так, чтобы Алиса могла отвечать по любым большим внешним B2B-базам, особенно по уже имеющимся решениям от Яндекс 360. Улучшение Excel
Все RAG не любят таблицы из-за неочевидного ретрива, сепараторов, переполнения входа числами. Но у нас, как ML-специалистов, в сердце выделено особенное место под Pandas. Пора объединить эти вводные, автоматически решая задачи по таблицам через кодген. Зачем помнить import pandas as pd и эксель, когда можно попросить построить диаграмму AI в чате? Базовое качество
Грубо говоря, все проекты выше — продуктово интересное применение нашей технологии. Но это всё следствие кропотливой и очень важной работы над базовым качеством ответа по документам. Развитие базовой технологии мы не можем остановить ни на секунду. Наш ассистент не всегда хорошо сравнивает спецификации товаров, не способен поставить диагноз вместо врача и может не понимать обозначения резьбы на чертеже. Но какая конкретно модель/технология под капотом стека OCR/VLM/IR/LLM нас подводит? Готовы ли вы это полечить?

Ключевые навыки:

  • Обладаете глубокими знаниями в Deep Learning и NLP
  • Работали с LLM и пайплайнами вокруг них (function calling, memory, RAG)
  • Внедряли ML-системы в продакшен
  • Мыслите системно — от архитектуры до интеграции с инфраструктурой
  • Пишете на Python, знакомы с PyTorch
  • Готовы к кросс-функциональной работе с бэкендом и продуктовыми командами