YTsaurus — платформа для распределённого хранения и обработки больших данных, которой пользуются почти все сервисы Яндекса. После выхода в опенсорс мы активно развиваем платформу не только внутри компании, но и за её пределами. CHYT — подсистема YTsaurus, которая позволяет за доли секунды обрабатывать данные из YTsaurus с помощью SQL-диалекта и колоночного движка запросов ClickHouse. CHYT используют для аналитических запросов, построения графиков и дашбордов в DataLens, DBeaver и других BI-инструментах. Мы ищем разработчика, который поможет развивать CHYT: улучшать совместимость с ClickHouse, ускорять выполнение запросов и добавлять функциональность, востребованную пользователями. Почему это интересно: * Вы будете работать над системой, которая используется в реальных высоконагруженных сценариях * Сможете влиять и на производительность запросов, и на развитие пользовательской функциональности * Будете решать задачи на стыке C++, баз данных, SQL-движка и распределённых систем * Получите возможность развивать опенсорс-продукт с большой внутренней и внешней аудиторией

Обязанности:

Развивать интеграцию YTsaurus и ClickHouse
Благодаря совместимости интерфейсов ClickHouse и CHYT пользователи могут работать с CHYT через привычные инструменты и библиотеки. Вам предстоит: * Добавлять поддержку новых типов данных и возможностей YTsaurus * Поддерживать совместимость с новыми версиями ClickHouse * Расширять сценарии использования CHYT Ускорять выполнение запросов
Быстрая работа запросов критична для аналитики, графиков и дашбордов. Мы оптимизируем весь путь выполнения запроса — от чтения данных до распределённого исполнения. В зоне ответственности команды: * Оптимизация кода перевода данных из дискового формата YTsaurus во внутреннее поколоночное представление ClickHouse * Эффективная работа с метаданными YTsaurus * Механизмы мониторинга и диагностики, позволяющие пользователям самостоятельно анализировать загрузку и искать узкие места Работать с сообществом
YTsaurus — продукт с большим количеством пользователей внутри Яндекса и с активным внешним комьюнити. Вам нужно будет разбираться в пользовательских сценариях, принимать пул-реквесты от внешних контрибьюторов и рассказывать о наших достижениях на конференциях.

Ключевые навыки:

  • Занимались бэкенд-разработкой, в частности разработкой в области систем хранения и баз данных
  • Уверенно владеете C++
  • Понимаете базовые принципы работы баз данных
  • Готовы предлагать идеи и участвовать в планировании, а не просто выполнять задачи

Дополнительные требования:

  • Пишете на Go
  • Знаете SQL
  • Уверенно работаете в Linux
  • Знакомы с ClickHouse
  • Разрабатывали ClickHouse, PostgreSQL, MySQL или другие СУБД
  • Изучали распределённые системы или базы данных на курсах или в рамках практики