Обязанности:
  • Формирование долгосрочной стратегии платформы (Hardware, LLM/ML-платформа, стандарты, SLO/SLA, Cloud). Локальная инфра 8× NVIDIA H200 и Yandex Cloud;
  • Строить с нуля MLOps-платформу, ML-конвейеры, DWH, Data pipelines;
  • Кастомизация и развертывание LLM-моделей на локальных GPU;
  • Проектировать и эксплуатировать масштабируемые LLM/ML-пайплайны и data-workflows. On-prem инфраструктуру. Prod, R&D, DR контуры;
  • Деплоить, мониторить и оптимизировать сервисы LLM/ML-инференса (задержка, пропускная способность, autoscaling, стоимость);
  • Строить и поддерживать data-инфраструктуру: ETL/ELT, batch/stream-обработку, слои хранения (SQL/NoSQL, object storage, data lake/warehouse). Выстраивать интеграции разных источников данных с низкой задержкой;
  • End-to-end производительность: профилирование узких мест по данным и инференсу, поставка оптимизаций;
  • Укреплять надёжность и безопасность: observability/наблюдаемость, алерты, доступы, аудит-трейлы, DR;
  • Запускать сервисы с нуля и доводить до продакшена.
Требования:
  • 5+ лет в MLOps/Devops;
  • 3+ лет опыта работы с LLM/ML в production (обязательно).
  • Сильный Python и SQL.
  • Практика GPU-инференса: профилирование, квантование, ONNX/TensorRT, Nvidia Triton.
  • Опыт с LLM/RAG/мультиагентными фреймворками.
  • Опыт с контейнерами и CI/CD. Понимание оркестрации, сетей и on-prem-хранилищ.
  • Kafka, ClickHouse, Postgres, Airflow, векторные БД, k8s, DataSphere, LangChain, Kubeflow, Mlflow, Feast.
  • Плюс: опыт с RU-fintech данными с биржи MOEX, новости Интерфакс, Cbonds, Market data, Tradingview.
Условия:
  • Комфортный офис в Москва Сити (гибридный формат работы);

  • ДМС с первого дня работы, включающая стоматологию, страхование жизни и возможность подключения родственников;

  • Сервис корпоративных скидок Best Benefit;

  • Конкурентный уровень заработной платы.