Aston — аккредитованная аутсорсинговая IT-компания, работающая с 2007 года. Наш штат насчитывает 2500+ специалистов. Мы разрабатываем программное обеспечение и IT-решения в сферах Finance, Healthcare, eCommerce, IoT, Media, Big Data, ML и многом другом.
Заказчик – быстроразвивающаяся ИТ-компания, с 2020 года разрабатывает инновационные решения для цифровизации бизнеса. Работает с ведущими компаниями финансового сектора и предлагает им комплексные решения для фронт- и бэк-офиса, финтех-продукты и системы работы с большими данными.
Почему это будет интересно?
Требования:
- опыт работы в промышленной разработке в роли MLOps Engineer от 1,5 лет;
- наличие высшего образования;
- отличные знания Python 3.11;
- опыт работы с asyncio, multiprocessing, threading;
- опыт работы с Docker: сборка сервисов, оптимизация;
- опыт работы с k8s: helm, конфигурации, hpa, понимание масштабирования сервисов с ML моделями на CPU/GPU;
- опыт работы с FastAPI, FastStream+Kafka: web-разработка, умение писать сервисы, оборачивать существующие ML решения в сервисы;
- опыт работы с Prometheus, Grafana, ELK: настройка метрик, журналирование внутри сервисов, конфигурации;
- опыт работы с Opensearch: векторные БД, индексация;
- знание Apache Airflow , базовые знания DAG.
Обязанности:
- проводить контейнеризацию ML-моделей с использованием Docker и развертывать в Kubernetes кластерах;
- настраивать и управлять оркестрацией ML-пайплайнов через Apache Airflow;
- обеспечивать масштабируемость и отказоустойчивость ML-сервисов в on-premise средах;
- подключать сервисы к системам мониторинга и журналирования;
- анализировать и устранять инциденты в работе ML-сервисов на третьей линии поддержки;
- оптимизировать использования вычислительных ресурсов;
- разрабатывать интеграции между ML-сервисами через REST API и системы обмена сообщениями (Kafka);
- создавать автоматизированные пайплайны для обработки данных, feature engineering и тестирования моделей;
- внедрять Infrastructure as Code подходы для управления ML-инфраструктурой.