Должность: Lead SRE / MLOps / DevOps.

Проект — развитие централизованной MLOps-экосистемы крупного банка. Команда отвечает за платформу полного цикла работы с ML-моделями — от разработки до эксплуатации.

В рамках платформы:

  • Среда разработки моделей (train / inference пайплайны)
  • Среда исполнения моделей
  • Платформа доставки
  • Feature Store
  • AutoML и внутренняя ML-платформа для аналитиков
  • A/B тестирование
  • RAG / LLMOps
  • Системы обработки документов с использованием ИИ

Чем предстоит заниматься:

  • Развитие и ответственность за observability стек платформы и смежных решений
  • Роль связующего звена между командами разработки, инфраструктуры и сопровождения
  • Создание и развитие инструментов для работы в едином ML-контуре (совместно с dev-командами)
  • Масштабирование ML-платформы и инфраструктурных решений
  • Участие в развитии централизованной MLOps-экосистемы
  • Повышение надежности, отказоустойчивости и прозрачности систем

Ожидания от кандидата:

  • Опыт SRE / DevOps от 3+ лет
  • Опыт работы с MLOps / ML-инфраструктурой от 1 года
  • Уверенное администрирование Kubernetes (от 2 лет)
  • Опыт работы с CI/CD (Jenkins / GitLab CI), Docker, Helm
  • Знание Python

Опыт работы с инструментами MLOps:

  • Airflow, MLflow, Argo Workflows, JupyterHub, Seldon, KServe, CUDA

Опыт работы с big data стеком:

  • Hadoop, Spark, Kafka, ELK

Стек:

  • Kubernetes, Docker, Helm, Jenkins / GitLab CI, Python
  • Airflow, MLflow, Argo, Seldon, KServe, JupyterHub
  • Hadoop, Spark, Kafka, ELK
  • ML pipelines, Feature Store, AutoML, RAG / LLMOps

Условия:

  • ДМС со стоматологией
  • Компенсация фитнеса
  • Скидки на курсы английского (Skyeng) и в кино
  • Индексация зарплаты
  • Современная техника для работы
  • IT-аккредитация