👥 О нас:
Мы — управление экспериментальных систем машинного обучения (УЭСМО или RnD ML), разрабатываем прорывные AI-решения.
🤖 Native Omnimodality & VLA
Создание нативных омнимодальных архитектур, новых способов кодирования и совместного обучения в доменах изображений, аудио, видео и т.д. Разработка принципиально новых представлений и кодирования информации, а также стрим VLA взаимодействия с роботами 🤖
🚀 LLM "bleeding edge" R&D
Эксперименты с архитектурами LLM, оркестрация моделей, разработка прототипов агентных фреймворков и перспективных подходов к обучению, исследования по всему фронтиру современного LLM-строения.
🎙️ Native Speech & Audio Editing
Разработка омнимодальной Full-Duplex архитектуры, которая слышит, говорит, нативно понимает перебивания и одновременно работает с речью, текстом и визуальной информацией. Проектирование архитектуры инструктивного редактирования в домене аудио. 🎼✨
🧠 Omnimodal reasoning
Задачи имплементации нативного латентного и омнимодального ризонинга в LLM и VLM. Мультимодальный reasoning и синхронизация потоков разных модальностей (audio–text–vision), включая стримы UI и VLA.
💻 Computer Operator
Задачи управления компьютерами, телефонами, браузерами и т.п. Мы прицельно улучшаем работу моделей в этих задачах, используя передовые методы обучения (такие как online RL в средах).
🔎 Benchmarking
Занимается передовыми исследованиями в области LLM и мультимодальных моделей, AI-агентов и LM-as-Judge. Создаем новые подходы к оценке, обучаем генеративные модели и исследуем их способности. Результаты представляем на ведущих конференциях высшего уровня А/А\*, а также применяем в продуктах.
👩💻 Product Manager
Ищем PM в команду, которая работает на переднем крае технологий. Никакой поддержки легаси — только R&D, early stage и high uncertainty. Здесь не работает подход «собрал требования — передал в разработку». Мы превращаем свежие исследования в MVP, структурируем хаос и проверяем гипотезы в условиях, когда готового решения нет.
🛠 Data Engineering
Ищем дата-инженеров, которые будут выстраивать сложные мультимодальные пайплайны сбора, разметки, валидации данных для обучения моделей во всех перечисленных выше ML-стримах.
📩 В сообщении укажите, на какую позицию откликаетесь!
Обязанности
- работа с большими языковыми моделями, разбор имеющихся пайплайнов по кирпичикам, поиск направлений, где можно сделать diff +1-10%, генерация исследовательских гипотез, где можно сделать diff x2-x10
- обучение, валидация и имплементация новых state-of-the-art подходов для соответствующих задач
- упаковка исследований и презентация результатов, delivery до прод GigaChat
- публикация результатов исследований в топовых научных конференциях (опционально).
Требования
- опыт в современном трансформерном NLP, отличное теоретическое понимание этапов разработки топовых индустриальных LLM, практический опыт (включая pet-проекты) хотя бы в одном релевантном этапе
- хорошая насмотренность по научным и индустриальным статьям, понимание, в какую сторону развивается отрасль, какие направления исследований самые «горячие», какими методами/моделями/датасетами достигаются те или иные результаты, какими бенчмарками это валидируется и т.п.
**Будет плюсом:**
- большой опыт в классическом ML/NLP
- публикации уровня А/А\* и опыт написания статей
- призовые места в соревнованиях по машинному обучению (Kaggle, etc.).
