Проект в ритейле, связанный с прогнозированием спроса для пополнения магазинов и складов (временные ряды).
Локация: РФ/РБ. Формат: удаленно. Требуется разница во времени с Мск не более ±2 часа.
Основные требования:
- Опыт в Data Science / Machine Learning от 2,5 лет;
- Глубокие знания Python, SQL и PySpark; разработка ETL-процессов для обработки больших данных (чтение, трансформация, агрегация, запись); оптимизация Spark-запросов (партиционирование, кэширование, работа с broadcast-переменными);
- Знание ML-фреймворков: Scikit-learn, TensorFlow/PyTorch;
- Опыт работы с данными: обработка, анализ, feature engineering;
- Понимание продакшн-разработки и умение запускать ML-модели в PySpark (Spark MLlib, PySpark Pandas UDFs);
- Умение реалистично оценивать сроки, искать прагматичные решения и доводить проекты до конца; коммуникативность и неконфликтность.
Дополнительные ожидания:
- Опыт продакшн-разработки (не только исследования);
- Понимание бизнес-процессов, а не только работы в Jupyter Notebook.
Задачи:
- Поддержка и развитие моделей прогнозирования спроса (краткосрочная для снабжения магазинов и долгосрочная для пополнения распределительных центров);
- Около 70% времени — практическая ML-разработка: код, исследования, эксперименты; около 30% — коммуникации, презентации и работа с требованиями.
Занятость: фулл тайм.