Привет! Это команда ML-модерации. Мы ищем крутого специалиста, которому интересно работать на стыке ML и данных, пробовать новые алгоритмы обработки и исследования данных, а также выстраивать автоматизированые процессы, для упрощения жизни. Команда состоит из опытных и весёлых аналитиков данных, которые всегда готовы прийти на помощь в трудную минуту!
ML-модерация наполнена различными процессам обработки и проверки пользовательских данных, поэтому в нашу команду могут прилетать абсолютно разные задачи, связанные с анализом данных и моделей, исследованиями новых подходов к оценке качества существущих решений, разработкой новых продуктовых решений и многое другое!
Вы будете
- Оперировать с большими данными.
- Анализировать и проверять применимость различных решений.
- Оценивать и настраивать качество существующих моделей.
- Выстраивать пайплайны обработки данных.
- Экспериментировать с различными ML-алгоритмами.
- Строить крутые графики в различных разрезах.
Нам важно
- Знание основных библиотек Python (в том числе регулярные выражения).
- Знание теории вероятностей и математической статистики.
- Понимание устройства DWH-системы.
- Умение работать с HDFS и PySpark.
- Знание SQL (диалекты ClickHouse, Vertica), умение оптимизировать запросы.
- Понимание и использование ML-алгоритмов для анализа данных.
Будет плюсом
- Опыт работы с Grafana.
- Опыт работы с Superset.
- Опыт работы с AirFlow.
- Опыт работы с запросами HTTP/gRPS, в том числе через Swagger.
- Опыт работы с CI/CD-пайплайнами в GitLab.
- Опыт работы с NVIDIA Triton Inference Server и Docker.