Наша команда занимается аналитикой базовой технологии, лежащей под капотом Алисы, Нейропоиска, Нейробраузера и многих других продуктов, — большой языковой модели Alice AI. Вот некоторые из наших рабочих вопросов: * Как определить, с какими задачами модель справляется хорошо, а с какими — не очень? * Какие данные добавить в finetune, чтобы обучить модель новой задаче? * Откуда взять эти данные и как проконтролировать их качество? * Как построить процесс краудсорсинговой разметки? Давайте искать на них ответы вместе!

Обязанности:

Развитие модели
В эту задачу входят проактивный поиск ошибок модели и исправление проблемных срезов, оценка эффективности изменений и последующее внедрение улучшений. Формирование базы данных
Вы будете собирать данные для разработки и интеграции новых функций. Обучение исполнителей
Вам предстоит подбирать и обучать квалифицированных исполнителей, разрабатывать для них систему мотивации, контролировать качество разметки и внедрять процессы для улучшения результатов. Больше об аналитике в Яндексе — в канале Yandex for Analytics

Ключевые навыки:

  • Любите работать с текстовыми данными
  • Знаете математическую статистику и теорию вероятностей
  • Умеете писать на Python и SQL
  • Самостоятельны и готовы браться за новые задачи, для которых нет готового решения

Дополнительные требования:

  • Работали с Толокой или другими краудсорс-платформами