Обязанности:
- Проектировать и сопровождать дата-пайплайны, необходимые для работы ML-платформы.
- Разрабатывать и поддерживать офлайн (batch) сервисы обучения и инференса ML-моделей.
- Деплоить модели в продакшн, обеспечивать их стабильность работы и масштабируемость, разрабатывать систему мониторинга.
- Анализировать качество моделей.
- Сотрудничать с разными командами разработки и аналитики для интеграции моделей в прод.
Требования:
- Опыт работы в Data Engineering/ML не менее 3 лет.
- Уверенное владение SQL, Python. Понимание Lakehouse-концепций.
- Опыт работы с построением моделей (линейные/деревянные модели, ансамбли) для разных задач (регрессия, классификация, кластеризация, временные ряды и так далее).
- Навыки работы с контейнерами (Docker, Kubernetes), CI/CD (Jenkins), мониторингом (Prometheus, Grafana).
- Желание и способность работать в команде, обмениваться знаниями и опытом.
