👥 О нас:

Мы — управление экспериментальных систем машинного обучения (УЭСМО или RnD ML), разрабатываем прорывные AI-решения.

🤖 Native Omnimodality & VLA

Создание нативных омнимодальных архитектур, новых способов кодирования и совместного обучения в доменах изображений, аудио, видео и т.д. Разработка принципиально новых представлений и кодирования информации, а также стрим VLA взаимодействия с роботами 🤖

🚀 LLM "bleeding edge" R&D

Эксперименты с архитектурами LLM, оркестрация моделей, разработка прототипов агентных фреймворков и перспективных подходов к обучению, исследования по всему фронтиру современного LLM-строения.

🎙️ Native Speech & Audio Editing

Разработка омнимодальной Full-Duplex архитектуры, которая слышит, говорит, нативно понимает перебивания и одновременно работает с речью, текстом и визуальной информацией. Проектирование архитектуры инструктивного редактирования в домене аудио. 🎼✨

🧠 Omnimodal reasoning

Задачи имплементации нативного латентного и омнимодального ризонинга в LLM и VLM. Мультимодальный reasoning и синхронизация потоков разных модальностей (audio–text–vision), включая стримы UI и VLA.

💻 Computer Operator

Задачи управления компьютерами, телефонами, браузерами и т.п. Мы прицельно улучшаем работу моделей в этих задачах, используя передовые методы обучения (такие как online RL в средах).

🔎 Benchmarking

Занимается передовыми исследованиями в области LLM и мультимодальных моделей, AI-агентов и LM-as-Judge. Создаем новые подходы к оценке, обучаем генеративные модели и исследуем их способности. Результаты представляем на ведущих конференциях высшего уровня А/А\*, а также применяем в продуктах.

👩‍💻 Product Manager

Ищем PM в команду, которая работает на переднем крае технологий. Никакой поддержки легаси — только R&D, early stage и high uncertainty. Здесь не работает подход «собрал требования — передал в разработку». Мы превращаем свежие исследования в MVP, структурируем хаос и проверяем гипотезы в условиях, когда готового решения нет.

🛠 Data Engineering

Ищем дата-инженеров, которые будут выстраивать сложные мультимодальные пайплайны сбора, разметки, валидации данных для обучения моделей во всех перечисленных выше ML-стримах.

📩 В сообщении укажите, на какую позицию откликаетесь!

Обязанности

  • работа с большими языковыми моделями, разбор имеющихся пайплайнов по кирпичикам, поиск направлений, где можно сделать diff +1-10%, генерация исследовательских гипотез, где можно сделать diff x2-x10
  • обучение, валидация и имплементация новых state-of-the-art подходов для соответствующих задач
  • упаковка исследований и презентация результатов, delivery до прод GigaChat
  • публикация результатов исследований в топовых научных конференциях (опционально).

Требования

  • опыт в современном трансформерном NLP, отличное теоретическое понимание этапов разработки топовых индустриальных LLM, практический опыт (включая pet-проекты) хотя бы в одном релевантном этапе
  • хорошая насмотренность по научным и индустриальным статьям, понимание, в какую сторону развивается отрасль, какие направления исследований самые «горячие», какими методами/моделями/датасетами достигаются те или иные результаты, какими бенчмарками это валидируется и т.п.

**Будет плюсом:**

  • большой опыт в классическом ML/NLP
  • публикации уровня А/А\* и опыт написания статей
  • призовые места в соревнованиях по машинному обучению (Kaggle, etc.).