- Формирование долгосрочной стратегии платформы (Hardware, LLM/ML-платформа, стандарты, SLO/SLA, Cloud). Локальная инфра 8× NVIDIA H200 и Yandex Cloud;
- Строить с нуля MLOps-платформу, ML-конвейеры, DWH, Data pipelines;
- Кастомизация и развертывание LLM-моделей на локальных GPU;
- Проектировать и эксплуатировать масштабируемые LLM/ML-пайплайны и data-workflows. On-prem инфраструктуру. Prod, R&D, DR контуры;
- Деплоить, мониторить и оптимизировать сервисы LLM/ML-инференса (задержка, пропускная способность, autoscaling, стоимость);
- Строить и поддерживать data-инфраструктуру: ETL/ELT, batch/stream-обработку, слои хранения (SQL/NoSQL, object storage, data lake/warehouse). Выстраивать интеграции разных источников данных с низкой задержкой;
- End-to-end производительность: профилирование узких мест по данным и инференсу, поставка оптимизаций;
- Укреплять надёжность и безопасность: observability/наблюдаемость, алерты, доступы, аудит-трейлы, DR;
- Запускать сервисы с нуля и доводить до продакшена.
- 5+ лет в MLOps/Devops;
- 3+ лет опыта работы с LLM/ML в production (обязательно).
- Сильный Python и SQL.
- Практика GPU-инференса: профилирование, квантование, ONNX/TensorRT, Nvidia Triton.
- Опыт с LLM/RAG/мультиагентными фреймворками.
- Опыт с контейнерами и CI/CD. Понимание оркестрации, сетей и on-prem-хранилищ.
- Kafka, ClickHouse, Postgres, Airflow, векторные БД, k8s, DataSphere, LangChain, Kubeflow, Mlflow, Feast.
- Плюс: опыт с RU-fintech данными с биржи MOEX, новости Интерфакс, Cbonds, Market data, Tradingview.
-
Комфортный офис в Москва Сити (гибридный формат работы);
-
ДМС с первого дня работы, включающая стоматологию, страхование жизни и возможность подключения родственников;
-
Сервис корпоративных скидок Best Benefit;
-
Конкурентный уровень заработной платы.