Медиаплатформа Яндекса — один из основных генераторов трафика рунета. Мы разрабатываем инфраструктуру для обработки, хранения, передачи и показа мультимедийного контента (прямых трансляций, фильмов, сериалов, музыки и других форматов), которую используют крупные сервисы компании. Одновременно мы обслуживаем сотни тысяч пользователей и передаём терабиты трафика в секунду. Подробнее о команде и её задачах — на странице. Мы ищем аналитика-разработчика, который будет работать с данными Медиаплатформы и писать код для их анализа, построения метрик, поиска аномалий и автоматизации расчётов. Вам предстоит разбираться в сложной технической системе, искать закономерности в больших потоках событий и помогать командам принимать решения на основе данных.

Обязанности:

Анализ и исследования
Вы будете анализировать логи просмотров, телеметрию плееров, данные о качестве воспроизведения, CDN, бэкенд-компонентах и транскодинге. Также вам предстоит исследовать пользовательский опыт (почему меняются время старта, какова успешность запуска, буферизация, какие есть ошибки воспроизведения и другие ключевые показатели качества). Кроме того, в числе ваших задач будут анализ A/B-экспериментов, поиск аномалий и формулировка выводов, которые помогают принимать решения. Развитие системы, проектирование и разработка метрик
Вам нужно будет развивать систему технических и продуктовых метрик платформы (включая инструменты измерения качества, аналитические витрины и кубы), проектировать пайплайны, дашборды и внутренние инструменты для анализа, мониторинга и поддержки разработчиков в отладке. Вместе с разработчиками вы будете находить узкие места в воспроизведении и доставке контента, приоритизировать улучшения. Также вам предстоит разрабатывать новые метрики и ML-компоненты — например, систему для предсказания оптимального стартового качества видео на основе накопленных логов.
Больше об аналитике в Яндексе — в канале Yandex for Analytics

Ключевые навыки:

  • Работали с аналитическими СУБД (желательно с ClickHouse)
  • Строили метрики, витрины, дашборды или внутренние аналитические сервисы
  • Уверенно владеете SQL и работаете с большими объёмами данных
  • Умеете писать код для анализа, автоматизации и разработки прикладных инструментов
  • Понимаете основы статистики и методы анализа A/B-экспериментов
  • Можете самостоятельно формулировать задачи, работать с неоднозначными данными и доводить анализ до полезного результата
  • Готовы глубоко погружаться в технический контекст и общаться с инженерами на одном языке

Дополнительные требования:

  • Работали с DataLens или другими BI-инструментами
  • Анализировали observability- и telemetry-данные высоконагруженных систем
  • Проектировали схемы событий, проверяли корректность данных и строили аналитические пайплайны
  • Понимаете технологии видеостриминга (видеокодеки, HLS/DASH, CDN, ABR, startup time, rebuffering, latency)
  • Умеете решать задачи машинного обучения или проявляете явный интерес к применению ML в аналитике данных