Обязанности:

Формирование долгосрочной стратегии платформы (Hardware, LLM/ML-платформа, стандарты, SLO/SLA, Cloud). Локальная инфра 8× NVIDIA H200 и Yandex Cloud;
Строить с нуля MLOps-платформу, ML-конвейеры, DWH, Data pipelines;
Кастомизация и развертывание LLM-моделей на локальных GPU;
Проектировать и эксплуатировать масштабируемые LLM/ML-пайплайны и data-workflows. On-prem инфраструктуру. Prod, R&D, DR контуры;
Деплоить, мониторить и оптимизировать сервисы LLM/ML-инференса (задержка, пропускная способность, autoscaling, стоимость);
Строить и поддерживать data-инфраструктуру: ETL/ELT, batch/stream-обработку, слои хранения (SQL/NoSQL, object storage, data lake/warehouse). Выстраивать интеграции разных источников данных с низкой задержкой;
End-to-end производительность: профилирование узких мест по данным и инференсу, поставка оптимизаций;
Укреплять надёжность и безопасность: observability/наблюдаемость, алерты, доступы, аудит-трейлы, DR;
Запускать сервисы с нуля и доводить до продакшена.

Требования:

5+ лет в MLOps/Devops;
3+ лет опыта работы с LLM/ML в production (обязательно).
Сильный Python и SQL.
Практика GPU-инференса: профилирование, квантование, ONNX/TensorRT, Nvidia Triton.
Опыт с LLM/RAG/мультиагентными фреймворками.
Опыт с контейнерами и CI/CD. Понимание оркестрации, сетей и on-prem-хранилищ.
Kafka, ClickHouse, Postgres, Airflow, векторные БД, k8s, DataSphere, LangChain, Kubeflow, Mlflow, Feast.
Плюс: опыт с RU-fintech данными с биржи MOEX, новости Интерфакс, Cbonds, Market data, Tradingview.

Условия:

Комфортный офис в Москва Сити (гибридный формат работы);
ДМС с первого дня работы, включающая стоматологию, страхование жизни и возможность подключения родственников;
Сервис корпоративных скидок Best Benefit;
Конкурентный уровень заработной платы.

ML Ops

Описание вакансии