Должность: Lead SRE / MLOps / DevOps.
Проект — развитие централизованной MLOps-экосистемы крупного банка. Команда отвечает за платформу полного цикла работы с ML-моделями — от разработки до эксплуатации.
В рамках платформы:
Среда разработки моделей (train / inference пайплайны)
Среда исполнения моделей
Платформа доставки
Feature Store
AutoML и внутренняя ML-платформа для аналитиков
A/B тестирование
RAG / LLMOps
Системы обработки документов с использованием ИИ
Чем предстоит заниматься:
- Развитие и ответственность за observability стек платформы и смежных решений
- Роль связующего звена между командами разработки, инфраструктуры и сопровождения
- Создание и развитие инструментов для работы в едином ML-контуре (совместно с dev-командами)
- Масштабирование ML-платформы и инфраструктурных решений
- Участие в развитии централизованной MLOps-экосистемы
- Повышение надежности, отказоустойчивости и прозрачности систем
Ожидания от кандидата:
- Опыт SRE / DevOps от 3+ лет
- Опыт работы с MLOps / ML-инфраструктурой от 1 года
- Уверенное администрирование Kubernetes (от 2 лет)
- Опыт работы с CI/CD (Jenkins / GitLab CI), Docker, Helm
- Знание Python
Опыт работы с инструментами MLOps:
- Airflow, MLflow, Argo Workflows, JupyterHub, Seldon, KServe, CUDA
Опыт работы с big data стеком:
- Hadoop, Spark, Kafka, ELK
Стек:
Kubernetes, Docker, Helm, Jenkins / GitLab CI, Python
Airflow, MLflow, Argo, Seldon, KServe, JupyterHub
Hadoop, Spark, Kafka, ELK
ML pipelines, Feature Store, AutoML, RAG / LLMOps
Условия:
- ДМС со стоматологией
- Компенсация фитнеса
- Скидки на курсы английского (Skyeng) и в кино
- Индексация зарплаты
- Современная техника для работы
- IT-аккредитация