Привет! Это команда ML-модерации. Мы ищем крутого специалиста, которому интересно работать на стыке ML и данных, пробовать новые алгоритмы обработки и исследования данных, а также выстраивать автоматизированые процессы, для упрощения жизни. Команда состоит из опытных и весёлых аналитиков данных, которые всегда готовы прийти на помощь в трудную минуту!
ML-модерация наполнена различными процессам обработки и проверки пользовательских данных, поэтому в нашу команду могут прилетать абсолютно разные задачи, связанные с анализом данных и моделей, исследованиями новых подходов к оценке качества существущих решений, разработкой новых продуктовых решений и многое другое!

Вы будете

  • Оперировать с большими данными.
  • Анализировать и проверять применимость различных решений.
  • Оценивать и настраивать качество существующих моделей.
  • Выстраивать пайплайны обработки данных.
  • Экспериментировать с различными ML-алгоритмами.
  • Строить крутые графики в различных разрезах.

Нам важно

  • Знание основных библиотек Python (в том числе регулярные выражения).
  • Знание теории вероятностей и математической статистики.
  • Понимание устройства DWH-системы.
  • Умение работать с HDFS и PySpark.
  • Знание SQL (диалекты ClickHouse, Vertica), умение оптимизировать запросы.
  • Понимание и использование ML-алгоритмов для анализа данных.

Будет плюсом

  • Опыт работы с Grafana.
  • Опыт работы с Superset.
  • Опыт работы с AirFlow.
  • Опыт работы с запросами HTTP/gRPS, в том числе через Swagger.
  • Опыт работы с CI/CD-пайплайнами в GitLab.
  • Опыт работы с NVIDIA Triton Inference Server и Docker.