Обязанности:
Создание метрик для ML-моделейНаша команда не обучает модели, но пытается ответить на вопрос, что такое «хорошо» для ML-модели. За ним скрывается множество исследований данных, поведения моделей, генерации и проверки гипотез, потому что это «хорошо» значительно проще описать интуитивно, чем заключить в строгие математические формулы. Сбор данных через краудсорсинг
Обучение и валидация моделей требуют большого количества очень хорошо размеченных данных. Получить которые чаще всего можно, только специально попросив людей их разметить. Что именно, с каким пониманием инструкции и насколько качественно будут размечать — вот вопросы, на которые мы должны уметь ответить. Продуктовые исследования
Мы помогаем направлять развитие продукта, вглядываясь в данные. Чтобы понять потребности и боли пользователей, мы исследуем всё — от конкретных баг-репортов до ежедневных терабайт данных про пользование Алисой. А когда все решения по нашим числам приняты, смотрим А/В-тесты и оцениваем реальную пользу (или вред) от изменений. Больше об аналитике в Яндексе — в канале Yandex for Analytics
Ключевые навыки:
- Занимались аналитикой больше двух лет
- Уверенно пишете на Python и SQL, знакомы с основными библиотеками
- Знаете основы машинного обучения
- Любите смотреть в данные и приносить пользу продукту и пользователю
Дополнительные требования:
- Знакомы с YQL, Python, Нирваной, Толокой
- Знаете статистику
- Любите и умеете структурировать информацию, выделять важное
