Обязанности:

  • Внедрять и поддерживать ML-модели в продуктах команды;
  • Оптимизировать использование инфраструктурных ресурсов в ML-сервисах (CPU/GPU, хранилища, сети);
  • Изучать и внедрять новые технологии для повышения производительности и масштабируемости;
  • Выстраивать процессы взаимодействия ML и Dev-команд для сокращения Time-to-Market;
  • Разрабатывать устойчивые интеграции с внешними и внутренними источниками данных;
  • Покрывать код юнит- и интеграционными тестами, добавлять метрики и мониторинг;
  • Создавать дашборды для технических метрик (Prometheus, Grafana);
  • Разрабатывать инструменты автоматизации для внутренних процессов и задач команды;
  • Улучшать CI/CD-процессы и инфраструктуру развертывания (Kubernetes, GitLab CI/CD, ArgoCD и т.п.);
  • Следовать единым подходам к созданию сервисов и обеспечению их observability.

Требования:

  • Глубокое знание Python 3.x и современных подходов к разработке (типизация, тестирование, асинхронность, архитектура);
  • Опыт разработки, обучения и внедрения ML-моделей;
  • Понимание полного цикла ML-продукта - от данных и экспериментов до деплоя и мониторинга;
  • Навыки интеграции моделей в сервисы (API, микросервисы, inference-сервера);
  • Опыт работы с Docker и Kubernetes;
  • Умение писать чистый, поддерживаемый и тестируемый код;
  • Опыт настройки CI/CD и базового мониторинга сервисов.