Aston — аккредитованная аутсорсинговая IT-компания, работающая с 2007 года. Наш штат насчитывает 2500+ специалистов. Мы разрабатываем программное обеспечение и IT-решения в сферах Finance, Healthcare, eCommerce, IoT, Media, Big Data, ML и многом другом.

Заказчик – быстроразвивающаяся ИТ-компания, с 2020 года разрабатывает инновационные решения для цифровизации бизнеса. Работает с ведущими компаниями финансового сектора и предлагает им комплексные решения для фронт- и бэк-офиса, финтех-продукты и системы работы с большими данными.

Почему это будет интересно?

Требования:

  • опыт работы в промышленной разработке в роли MLOps Engineer от 1,5 лет;
  • наличие высшего образования;
  • отличные знания Python 3.11;
  • опыт работы с asyncio, multiprocessing, threading;
  • опыт работы с Docker: сборка сервисов, оптимизация;
  • опыт работы с k8s: helm, конфигурации, hpa, понимание масштабирования сервисов с ML моделями на CPU/GPU;
  • опыт работы с FastAPI, FastStream+Kafka: web-разработка, умение писать сервисы, оборачивать существующие ML решения в сервисы;
  • опыт работы с Prometheus, Grafana, ELK: настройка метрик, журналирование внутри сервисов, конфигурации;
  • опыт работы с Opensearch: векторные БД, индексация;
  • знание Apache Airflow , базовые знания DAG.

Обязанности:

  • проводить контейнеризацию ML-моделей с использованием Docker и развертывать в Kubernetes кластерах;
  • настраивать и управлять оркестрацией ML-пайплайнов через Apache Airflow;
  • обеспечивать масштабируемость и отказоустойчивость ML-сервисов в on-premise средах;
  • подключать сервисы к системам мониторинга и журналирования;
  • анализировать и устранять инциденты в работе ML-сервисов на третьей линии поддержки;
  • оптимизировать использования вычислительных ресурсов;
  • разрабатывать интеграции между ML-сервисами через REST API и системы обмена сообщениями (Kafka);
  • создавать автоматизированные пайплайны для обработки данных, feature engineering и тестирования моделей;
  • внедрять Infrastructure as Code подходы для управления ML-инфраструктурой.