Обязанности:
Организовывать полный цикл ML-проектаВы будете отвечать за весь цикл: общаться с бизнес-заказчиком и формализовать задачи, заниматься EDA, разрабатывать прототип, проводить А/B-тесты и реализовывать продакшен-решения. Дизайнить эксперименты, придумывать новые способы оценки качества
Как собрать данные для обучения так, чтобы они были несмещёнными? Как оценить эффект от использования модели до внедрения, если её влияние растянуто во времени? На эти вопросы предстоит находить ответы. Искать оптимальный способ решать бизнес-задачи и влиять на сервис
Мы ищем наиболее эффективные способы решения задач, будь то ML, эвристические методы или исправление ошибок в коде. Важно понимать специфику продукта и ответственно подходить к работе. Больше об ML в Яндексе — в канале Yandex for ML
Ключевые навыки:
- Имеете хорошую алгоритмическую подготовку
- Владеете классическим стеком ML-разработки: Python (scikit-learn, XGBoost или CatBoost, pandas, Seaborn, Matplotlib и т. д.), SQL
- Понимаете, как правильно собрать данные для ML-задачи
- Умеете работать с большими объёмами данных и понимаете парадигму MapReduce
- Понимаете, как устроено DWH и пайплайны обработки данных в production
Дополнительные требования:
- Имеете опыт в NLP и LLM
- Владеете C++ или разрабатывали на нём
- Имеете высокие результаты в соревнованиях по ML, публикации, патенты или опенсорс-проекты
