Разработка технологии управления ИТ-инфраструктурой для задач обработки больших данных и искусственного интеллекта.

Требования:

  • Хорошее знание Python, промышленная разработка от 5 лет;
  • Знание Linux на уровне администрирования;
  • Опыт командной работы в дистанционном режиме.
  • Будет плюсом: опыт с GPU Nvidia / MTT, NVIDIA MIG, vGPU; опыт применения Volcano, Hami; разработка ИИ-агентов и приложений с LLM; использование Langfuse; интеграция с IDP (Keycloak и другие); работа с OpenTelemetry; мониторинг с Prometheus, Grafana, pgWatch.

Ключевые компетенции:

  • Docker, FastAPI, Pytest, Redis, Python 3, PostgreSQL 12

Обязанности:

  • Участие в разработке ядра системы управления, развертывания и мониторинга платформы ИИ-решений/моделей;
  • Работа со стеком: Python 3.x, FastAPI, Pytest, asyncio, PostgreSQL 12+, Ansible 2.9+, Docker/Kubernetes, Celery, Redis, nginx;
  • Декомпозиция и оценка трудоемкости задач, покрытие кода автотестами, оптимизация и рефакторинг, взаимодействие с frontend-разработчиками;
  • Инструменты разработки: GitLab, Jira, CI/CD, Confluence; работа по Agile (спринты, ежедневные стендапы).

Условия: локация и гражданство — РФ; продолжительность проекта >1 года; работа в дистанционном режиме возможна.