Python-разработчик в Yandex DataLens.

Какие задачи вас ждут

  • Строить гибкий API для решения задач анализа данных, оптимизировать построение модели данных. Датасеты — это способ объединить большое количество данных в модель, которая независимо от источника данных позволяет строить запросы к нему благодаря универсальному API. Датасеты должны быстро работать с любым количеством полей: это достигается различными оптимизациями и несколькими уровнями кеширования. Помимо развития API датасетов, команда также наполняет сервис и другими возможностями, улучшающими пользовательский опыт (это, к примеру, экспорты, алертинг, публичный API).
  • Разрабатывать коннекторы для подключения к новым источникам. Набор доступных коннекторов к источникам данных постоянно увеличивается, чтобы покрывать больше сценариев аналитики. Задача подключения каждого нового источника по-своему уникальна: необходимо не только разобраться в тонкостях его работы, но и продумать взаимодействие с коннектором с точки зрения пользователя.
  • Работать над масштабированием, стабильностью и скоростью работы сервиса. Команда отвечает за все этапы жизни сервиса, от проектирования и разработки до развёртывания и поддержания работоспособности всех окружений. Сервис обслуживается как внутри Яндекса — одна из крупнейших инсталляций среди подобных инструментов, так и в Yandex Cloud — крупнейший облачный сервис аналитики и визуализации в России. В планах: оптимизация пайплайнов CI/CD, улучшение инструментов мониторинга, развитие средств диагностики без прямого доступа к инсталляции и данным пользователей.
  • Развивать ядро сервиса в опенсорсе, чтобы открыть новые возможности для его расширения: поддерживать и развивать модульную архитектуру кода, выделять общие части, предоставляя точки для расширения.

Мы ждем, что вы

  • Разрабатывали на Python или готовы перейти на него с другого языка.
  • Работали с реляционными базами данных.
  • Строили и поддерживали отказоустойчивые системы.

Будет плюсом, если вы

  • Работали с Flask, AIOHTTP, SQLAlchemy.
  • Знакомы с Docker, Terraform, Kubernetes.
  • Работали с другими облаками.
  • Интересуетесь анализом и визуализацией данных и работали с другими BI-системами.