Мы создаём top-notch-решения для AI Productivity профессии аналитик данных, что включает в себя AI IDE с multi-tools-взаимодействием / AI YQL-codegen, тестовый стенд (делаем нечто похожее на LangFuse / [mlflow/kubeflow/clearml], но сфокусированное на оценке качества кодогенерации). Ищем в нашу команду сильного коллегу на позицию Старшего Аналитика-разработчика с опытом в LLM, AI-агентах, RAG. У нас классно, потому что: * мы работаем на стыке AI и больших данных — это две самые востребованные на текущий момент области; * наши продукты сразу видят тысячи пользователей внутри Яндекса, они напрямую влияют на бизнес-показатели; * мы даём возможность работать с современным стеком технологий и влиять на архитектурные решения; * в команде сильные специалисты по ML и data engineering, у которых можно многому научиться; * ваша работа будет влиять на развитие ключевых продуктов Поиска и Рекламы Яндекса; * мы создаём AI-инструменты для AI-продуктов — метазадача высшего уровня сложности.

Обязанности:

Работа с бизнес-пользователями
Необходимо понимать бизнес-контекст и реальные потребности людей. Разработка AI-агентов для работы с данными
Вы будете создавать и дообучать LLM-модели для понимания предметной области и генерации корректных аналитических запросов. Это включает работу с YQL, CHYT и другими внутренними технологиями Яндекса. Создание систем оценки качества AI-генерации и обогащение существующего дата-сета
Мы разрабатываем сложные бенчмарки и метрики для оценки точности сгенерированных запросов, проверки их синтаксической корректности и семантической адекватности. Интеграция AI в продукты блока Поиск и Реклама
Ваши решения будут напрямую влиять на эффективность работы с рекламными данными, качество аналитики и скорость принятия решений в ключевых бизнес-направлениях. Работа с большими объёмами разметки данных
Вы будете участвовать в создании датасетов для обучения и валидации моделей. Эксперименты с передовыми архитектурами нейронных сетей
Мы имеем амбиции в обучении с нуля некоторых нестандартных архитектур нейронных сетей. Безусловно, есть часть и с дообучением более стандартных моделей. Наставничество и работа в команде
Менеджмент младших коллег, создание стратегических партнёрств на уровне middle management.

Ключевые навыки:

  • Аккуратны и структурны в написании кода, пишете код, как senior backend developer
  • Глубоко понимаете машинное обучение, имеете практический опыт работы с LLM и знаете методы оценки
  • Умеете программировать на Python и имеете опыт работы с фреймворками ML (PyTorch, TensorFlow)
  • Знаете SQL и готовы разбираться с особенностями YQL и внутренних технологий Яндекса
  • Обладаете аналитическим мышлением и умеете формализовать сложные бизнес-требования
  • Самостоятельны и готовы брать ответственность за полный цикл разработки AI-решений
  • Умеете работать в команде и доносить сложные технические концепции до коллег

Дополнительные требования:

  • Хорошо разбираетесь в NLP
  • Имели опыт в AI-специфичном MLOps
  • Работали с библиотекой guidance или аналогами
  • Занимались промпт-инжинирингом и тонкой настройкой LLM, в т. ч. tools calling
  • Работали с finetuning LLM с доказанным ростом качества
  • Имеете опыт работы с распределёнными вычислениями и big data
  • Участвовали в разработке продуктовых AI-решений