Обязанности:
- проектирование и сопровождение дата пайплайнов, необходимых для работы ML-платформы;
- разработка и поддержка офлайн (batch) сервисов обучения и инференса ML-моделей;
- деплой моделей в продакшн, обеспечение их стабильности работы и масштабируемости, разработка системы мониторинга;
- анализ качества моделей;
- сотрудничество с разными командами разработки и аналитики для интеграции моделей в прод.
Требования:
- опыт работы в Data Engineering/ML не менее 3 лет;
- уверенное владение SQL, Python, понимание Lakehouse-концепций;
- опыт работы с построением моделей (линейные/деревянные модели, ансамбли) для разных задач (регрессия, классификация, кластеризация, временные ряды и т.д.);
- навыки работы с контейнерами (Docker, Kubernetes), CI/CD (Jenkins), мониторингом (Prometheus, Grafana);
- желание и способность работать в команде, обмениваться знаниями и опытом.
Будет плюсом:
- опыт с Apache Airflow, DBT, Apache Spark, Trino, Kafka, ClickHouse, S3, MLFlow;
- умение анализировать качество моделей с использованием различных классических и кастомных метрик;
- опыт работы с большими объемами данных и оптимизацией производительности моделей.
Условия:
- работа в любой точке мира: не привязываются к локации, платят в долларах, любят путешествовать;
- минимум бюрократии: удобные процессы, горизонтальные и открытые коммуникации, быстрое обсуждение идей и принятие решений;
- компенсация ДМС, психотерапии или иностранных языков, занятий спортом и больничного;
- возможность работать на Пхукете с видом на океан.