Aston — аккредитованная аутсорсинговая IT-компания, работающая с 2007 года. Наш штат насчитывает 2500+ специалистов. Мы разрабатываем программное обеспечение и IT-решения в сферах Finance, Healthcare, eCommerce, IoT, Media, Big Data, ML и многом другом.
Предлагаем присоединиться в роли ML Engineer и работать над проектом заказчика.
Заказчик – быстроразвивающаяся ИТ-компания, с 2020 года разрабатывает инновационные решения для цифровизации бизнеса. Работает с ведущими компаниями финансового сектора и предлагает им комплексные решения для фронт- и бэк-офиса, финтех-продукты и системы работы с большими данными.
Почему это будет интересно?
Требования:
- опыт работы в роли ML Engineer от 2,5 лет;
- наличие высшего образования;
- отличное знание Python 3.10+;
- опыт разработки высоконагруженных асинхронных сервисов, понимание Event Loop;
- опыт проектирования микросервисной архитектуры, знание паттернов (SOLID, Clean Architecture), опыт с REST и gRPC;
- знание SQL (PostgreSQL), опыт оптимизации запросов, работа с ORM (SQLAlchemy/Tortoise) и миграциями (Alembic);
- опыт работы с Redis (кэширование, очереди задач) и Kafka/RabbitMQ (event-driven системы);
- понимание TDD, опыт написания тестов (Pytest);
- знание Kubernetes;
- опыт работы с Git, настройки пайплайнов (GitLab CI/GitHub Actions);
- опыт с Prometheus, Grafana, ELK/Loki, Tracing (Jaeger/OpenTelemetry);
- опыт построения RAG-систем (Retrieval Augmented Generation) и работы с векторными базами данных (ChromaDB, Qdrant, pgvector, Milvus).
Обязанности:
- разработать ядро платформы: спроектировать и реализовать быстрые API на FastAPI для унифицированного доступа к LLM-моделям;
- создать сервисы управления: разработать микросервисы для контроля за запросами очереди, тарификация, квоты и доступы;
- обеспечить качество и метрики: создать системы для автоматического бенчмаркинга моделей и сбора метрик (задержка, пропускная способность, время ответа);
- оптимизировать архитектуру: сделать систему устойчивой к сбоям, внедрить асинхронность, кэширование и оптимизировать маршруты передачи данных;
- обеспечить наблюдаемость: наладить логирование и трейсинг для прозрачности работы и быстрой диагностики проблем;
- разработать инфраструктурные инструменты: автоматизировать развертывание, тестирование и проверку новых версий моделей.
