Обязанности:
- Внедрять и поддерживать ML-модели в продуктах команды;
- Оптимизировать использование инфраструктурных ресурсов в ML-сервисах (CPU/GPU, хранилища, сети);
- Изучать и внедрять новые технологии для повышения производительности и масштабируемости;
- Выстраивать процессы взаимодействия ML и Dev-команд для сокращения Time-to-Market;
- Разрабатывать устойчивые интеграции с внешними и внутренними источниками данных;
- Покрывать код юнит- и интеграционными тестами, добавлять метрики и мониторинг;
- Создавать дашборды для технических метрик (Prometheus, Grafana);
- Разрабатывать инструменты автоматизации для внутренних процессов и задач команды;
- Улучшать CI/CD-процессы и инфраструктуру развертывания (Kubernetes, GitLab CI/CD, ArgoCD и т.п.);
- Следовать единым подходам к созданию сервисов и обеспечению их observability.
Требования:
- Глубокое знание Python 3.x и современных подходов к разработке (типизация, тестирование, асинхронность, архитектура);
- Опыт разработки, обучения и внедрения ML-моделей;
- Понимание полного цикла ML-продукта - от данных и экспериментов до деплоя и мониторинга;
- Навыки интеграции моделей в сервисы (API, микросервисы, inference-сервера);
- Опыт работы с Docker и Kubernetes;
- Умение писать чистый, поддерживаемый и тестируемый код;
- Опыт настройки CI/CD и базового мониторинга сервисов.
