Обязанности:
Проектирование и запуск проектов разметки данныхВы будете работать с заказчиками — командами Яндекса, которым нужны размеченные данные. Ваша цель — понять их потребности, декомпозировать задачу, спроектировать процесс сбора и разметки данных, запустить стабильное техническое решение. Это может быть как простая текстовая или картиночная разметка, так и сложные, многоэтапные сценарии разметки, проверки и валидации. Пайплайны сбора и обработки данных
Вам нужно будет продумывать архитектуру хранения и обработки данных, создавать и совершенствовать дашборды и витрины данных. Анализ и контроль качества
Качество данных — ключевой показатель успеха. Вам предстоит определять метрики, строить дашборды, проводить эксперименты и анализировать результаты. Например, оценивать скорость разметки, точность исполнителей, влияние изменений в инструкциях и обучении на итоговый результат. Взаимодействие с командами и исполнителями
Вам предстоит координировать работу с командами-заказчиками, смежными инженерными группами и исполнителями заданий. Это включает в себя управление ожиданиями, согласование сроков, проведение встреч и обратную связь.
Ключевые навыки:
- Уверенно владеете Python и можете писать скрипты для обработки данных
- Умеете работать с большими файлами (JSON, TSV, CSV) и эффективно их обрабатывать
- Свободно пишете и применяете SQL-запросы для анализа и трансформации данных
- Понимаете основы инфографики и визуализации данных
- Имеете опыт взаимодействия с заказчиками (сбор требований, управление ожиданиями, фиксация результатов)
- Готовы работать в условиях быстро меняющихся требований и высокой неопределённости
Дополнительные требования:
- Работали с API и настраивали интеграции между сервисами
- Применяли методы математической статистики для анализа данных
- Знакомы с веб-разработкой, понимаете принцип построения архитектуры веб-сервисов (имеете опыт в коммерческих или пет-проектах)
- Знаете Groovy
- Имеете опыт проектного управления
- Знакомы с промпт-инжинирингом для автоматизации процессов
- Имеете опыт в машинном обучении: создавали или обучали модели в рабочих или академических проектах
