Обязанности:

  • проектирование и сопровождение дата пайплайнов, необходимых для работы ML-платформы;
  • разработка и поддержка офлайн (batch) сервисов обучения и инференса ML-моделей;
  • деплой моделей в продакшн, обеспечение их стабильности работы и масштабируемости, разработка системы мониторинга;
  • анализ качества моделей;
  • сотрудничество с разными командами разработки и аналитики для интеграции моделей в прод.

Требования:

  • опыт работы в Data Engineering/ML не менее 3 лет;
  • уверенное владение SQL, Python, понимание Lakehouse-концепций;
  • опыт работы с построением моделей (линейные/деревянные модели, ансамбли) для разных задач (регрессия, классификация, кластеризация, временные ряды и т.д.);
  • навыки работы с контейнерами (Docker, Kubernetes), CI/CD (Jenkins), мониторингом (Prometheus, Grafana);
  • желание и способность работать в команде, обмениваться знаниями и опытом.

Будет плюсом:

  • опыт с Apache Airflow, DBT, Apache Spark, Trino, Kafka, ClickHouse, S3, MLFlow;
  • умение анализировать качество моделей с использованием различных классических и кастомных метрик;
  • опыт работы с большими объемами данных и оптимизацией производительности моделей.

Условия:

  • работа в любой точке мира: не привязываются к локации, платят в долларах, любят путешествовать;
  • минимум бюрократии: удобные процессы, горизонтальные и открытые коммуникации, быстрое обсуждение идей и принятие решений;
  • компенсация ДМС, психотерапии или иностранных языков, занятий спортом и больничного;
  • возможность работать на Пхукете с видом на океан.