Проект: ритейл — прогнозирование спроса для пополнения магазинов и складов (временные ряды).
Условия: локация: РФ/РБ; гражданство: РФ/РБ; удаленно; фулл тайм; разница во времени с МСК не более ±2 часа.
Требования:
- Опыт в Data Science / Machine Learning от 2,5 лет;
- Глубокое знание Python, SQL и PySpark; разработка ETL-процессов для обработки больших данных (чтение, трансформация, агрегация, запись); оптимизация Spark-запросов (партиционирование, кэширование, работа с broadcast-переменными);
- Знание основных ML-фреймворков (Scikit-learn, TensorFlow/PyTorch);
- Опыт работы с данными: обработка, анализ, feature engineering;
- Опыт продакшн-разработки (не только исследовательской работы); умение запускать ML-модели в PySpark: использование Spark MLlib для распределённого обучения, работа с PySpark Pandas UDFs;
- Умение четко оценивать сроки и реалистично подходить к постановке задач; прагматизм и ответственность; коммуникабельность и неконфликтность.
Задачи:
- Поддерживать и развивать модели прогнозирования спроса: краткосрочные модели для снабжения магазинов и долгосрочные для пополнения распределительных центров;
- Около 70% времени — практическая ML-разработка: написание кода, исследования и эксперименты; остальное — коммуникация, подготовка презентаций и работа с требованиями.