Наша команда строит финтех-платформу нового поколения, объединяющую платёжные сервисы, риск-анализ, управление активами и real-time-аналитику в единую распределённую инфраструктуру. Мы создаём системы, которые должны быть всегда доступны, предсказуемы по времени ответа и устойчивы к сбоям, обрабатывая миллионы транзакций и миллиарды событий в сутки. Мы приглашаем в команду разработчиков, готовых решать сложнейшие задачи инженерной надёжности. Наш стек: Kotlin, Kafka, PostgreSQL, ClickHouse, Redis, Kubernetes, ArgoCD, Terraform, OpenTelemetry, Vault.

Обязанности:

Проектирование и развитие высоконадёжной финтех-платформы
Мы отвечаем за создание платформы с фокусом на latency, fault tolerance, resilience и scalability. Вам предстоит разрабатывать ключевые компоненты core-платформы, формировать инженерные стандарты и создавать инструменты для предсказуемой разработки и эксплуатации сервисов. Разработка self-healing- и self-observing-компонентов
Наша группа обеспечивает работу autoscaling, circuit-breaking, dynamic throttling и других механизмов самоисцеления систем. Мы строим платформу, которая автоматически адаптируется к нагрузке и минимизирует влияние сбоев. Построение стратегий надёжности и восстановления
Мы разрабатываем multi-region failover, zero-downtime rollout, rollback-механизмы и event-replay-системы. Это гарантирует бесперебойную работу платёжных сервисов даже в условиях нештатных ситуаций. **Больше о бэкенде в Яндексе — в канале Yandex for Backend**

Ключевые навыки:

  • Разрабатывали производительные распределённые системы
  • Знаете distributed systems, network protocols, concurrency control
  • Работали с Kubernetes, service meshes (Istio)
  • Понимаете SRE-практики: SLO/SLA, error budgets, blameless postmortems
  • Уверенно владеете одним из языков: C++, Go, Kotlin, Java, Python
  • Знакомы с observability stack: Prometheus, Grafana, OpenTelemetry

Дополнительные требования:

  • Работали с финансовыми и платёжными системами
  • Понимаете принципы транзакций, согласованности и PCI DSS
  • Разрабатывали high-load-системы с требованиями низкой задержки
  • Работали с Terraform, Kafka, gRPC,
  • Имеете опыт построения multi-region-архитектур