Ключевые задачи:
  • Построение скоринговых моделей и обнаружения аномалий в prodcution-ready проектах;

  • Построение ML-пайплайнов в режиме реального времени;

  • Интеграция ML-моделей в операционные системы компании;

  • Разработка графовых моделей для анализа связей;

  • Разработка NLP-модуля на базе on-premise LLM для анализа текстовых данных;

  • Участие в проектировании архитектуры данных: совместно с аналитиками и бизнесом (формализовать задачи, настроить метрики качества).

Навыки, которые нам необходимы:
  • Python (уверенно) и SQL (обязательно) — pandas, NumPy, работа с большими таблицами;
  • ML-модели — классификация, детекция аномалий, работа с несбалансированными данными;
  • Графовый анализ — NetworkX или PyTorch Geometric, понимание сетевых структур и другие;
  • MLOps — воспроизводимые эксперименты (MLflow), оркестрация (Airflow), контейнеризация (Docker);
  • Метрики — precision / recall / AUC в контексте бизнес-задачи, не только accuracy;
  • Git, Linux/bash — базовый уровень;
  • scikit-learn, XGBoost, LightGBM, PyTorch, NetworkX,

  • PyTorch Geometric;

  • pandas, NumPy, Apache Spark, MLflow, Docker, Apache Airflow;

  • FastAPI, Kubernetes (базово), HuggingFace Transformers, on-premise LLM

То, что ждет вас в команде:
  • Работа в стабильной и динамичной Компании;
  • Карьерный рост;
  • Социальный пакет по Коллективному договору
  • Отпуск 28 дней;
  • Яркая корпоративная жизнь.