Aston — аккредитованная аутсорсинговая IT-компания, работающая с 2007 года. Наш штат насчитывает 2500+ специалистов. Мы разрабатываем программное обеспечение и IT-решения в сферах Finance, Healthcare, eCommerce, IoT, Media, Big Data, ML и многом другом.

Предлагаем присоединиться в роли ML Engineer и работать над проектом заказчика.

Заказчик – быстроразвивающаяся ИТ-компания, с 2020 года разрабатывает инновационные решения для цифровизации бизнеса. Работает с ведущими компаниями финансового сектора и предлагает им комплексные решения для фронт- и бэк-офиса, финтех-продукты и системы работы с большими данными.

Почему это будет интересно?

Требования:

  • опыт работы в роли ML Engineer от 2,5 лет;
  • наличие высшего образования;
  • отличное знание Python 3.10+;
  • опыт разработки высоконагруженных асинхронных сервисов, понимание Event Loop;
  • опыт проектирования микросервисной архитектуры, знание паттернов (SOLID, Clean Architecture), опыт с REST и gRPC;
  • знание SQL (PostgreSQL), опыт оптимизации запросов, работа с ORM (SQLAlchemy/Tortoise) и миграциями (Alembic);
  • опыт работы с Redis (кэширование, очереди задач) и Kafka/RabbitMQ (event-driven системы);
  • понимание TDD, опыт написания тестов (Pytest);
  • знание Kubernetes;
  • опыт работы с Git, настройки пайплайнов (GitLab CI/GitHub Actions);
  • опыт с Prometheus, Grafana, ELK/Loki, Tracing (Jaeger/OpenTelemetry);
  • опыт построения RAG-систем (Retrieval Augmented Generation) и работы с векторными базами данных (ChromaDB, Qdrant, pgvector, Milvus).

Обязанности:

  • разработать ядро платформы: спроектировать и реализовать быстрые API на FastAPI для унифицированного доступа к LLM-моделям;
  • создать сервисы управления: разработать микросервисы для контроля за запросами очереди, тарификация, квоты и доступы;
  • обеспечить качество и метрики: создать системы для автоматического бенчмаркинга моделей и сбора метрик (задержка, пропускная способность, время ответа);
  • оптимизировать архитектуру: сделать систему устойчивой к сбоям, внедрить асинхронность, кэширование и оптимизировать маршруты передачи данных;
  • обеспечить наблюдаемость: наладить логирование и трейсинг для прозрачности работы и быстрой диагностики проблем;
  • разработать инфраструктурные инструменты: автоматизировать развертывание, тестирование и проверку новых версий моделей.