Мы - AI-стартап, который строит сложную real-time систему на стыке голосового ИИ и больших языковых моделей. Сейчас находимся на этапе активной разработки: нужно создать надёжный бэкенд, который обрабатывает голосовой поток в реальном времени, пропускает его через LLM и выдаёт полезный результат с минимальной задержкой
Кого ищем Backend-разработчика Middle+/Senior уровня, который готов брать на себя ответственность и строить архитектуру с нуля
Основные задачи:
- Разработка real-time пайплайна: Speech-to-Text → LLM → генерация результата
- Интеграции со speech-сервисами (Yandex SpeechKit streaming, SberSpeech, Whisper и др.)
- Продакшен-работа с LLM: обработка галлюцинаций, latency optimization, cost control, мониторинг качества
- Мультиарендная архитектура с соблюдением 152-ФЗ (безопасность и изоляция данных)
- Интеграции с внешними системами через тонкие адаптеры (без жёсткой привязки к одной платформе)
- WebSocket-сервер для доставки данных в реальном времени
- Мониторинг, fallback-механизмы и деградация при высоких нагрузках
Требования:
- Отличный Python (FastAPI, asyncio, Pydantic)
- Реальный опыт интеграций LLM в продакшен (не только pet-проекты)
- Понимание, как работают streaming voice-сервисы и реал-тайм системы
- Опыт с PostgreSQL, Docker, базовым Kubernetes
- Желание думать про продукт и UX при работе с latency
Будет большим плюсом:
- Опыт работы с высоконагруженными системами
- Знание мультиарендности и compliance-требований
- Опыт построения отказоустойчивых AI-пайплайнов
Условия:
- Полностью удалённый или гибридный формат работа (Россия, СНГ)
- Гибкий график, минимум встреч, максимум автономии
- Возможность сильно влиять на архитектуру и направление продукта
В нашей команде каждый разработчик видит прямой результат своей работы. Нет корпоративной бюрократии - есть сложные технические задачи и быстрые итерации.
Если ты устал от простых CRUD-задач и хочешь поработать с настоящим real-time AI, compliance и высокими требованиями к качеству - откликайся
