Проект в ритейле, связанный с прогнозированием спроса для пополнения магазинов и складов (временные ряды).

Локация: РФ/РБ. Формат: удаленно. Требуется разница во времени с Мск не более ±2 часа.

Основные требования:

  • Опыт в Data Science / Machine Learning от 2,5 лет;
  • Глубокие знания Python, SQL и PySpark; разработка ETL-процессов для обработки больших данных (чтение, трансформация, агрегация, запись); оптимизация Spark-запросов (партиционирование, кэширование, работа с broadcast-переменными);
  • Знание ML-фреймворков: Scikit-learn, TensorFlow/PyTorch;
  • Опыт работы с данными: обработка, анализ, feature engineering;
  • Понимание продакшн-разработки и умение запускать ML-модели в PySpark (Spark MLlib, PySpark Pandas UDFs);
  • Умение реалистично оценивать сроки, искать прагматичные решения и доводить проекты до конца; коммуникативность и неконфликтность.

Дополнительные ожидания:

  • Опыт продакшн-разработки (не только исследования);
  • Понимание бизнес-процессов, а не только работы в Jupyter Notebook.

Задачи:

  • Поддержка и развитие моделей прогнозирования спроса (краткосрочная для снабжения магазинов и долгосрочная для пополнения распределительных центров);
  • Около 70% времени — практическая ML-разработка: код, исследования, эксперименты; около 30% — коммуникации, презентации и работа с требованиями.

Занятость: фулл тайм.