Если ты строишь большие проекты на Spec-Driven разработке, выдаёшь 10–20k LOC/день прод-готового, грамотно спроектированного кода (не вайбкодинг), и веришь, что открытые модели с продвинутым harness'ом обыгрывают фронтир — читай дальше.
Мы строим Business Operating System — платформу, где AI-агенты создают и ведут бизнесы для предпринимателей.
Цель
Сделать работу AI-агентов автономной, целенаправленной и проактивной: Agentic Scaffolding поверх открытых моделей превращает цель в план, действия, evidence, feedback loop и escalation/rollback — чтобы агент не ждал промпта, а двигал задачу до результата.
Что делаешь
-
Проектируешь Agentic Scaffolding: goal graph, task queue, memory, tool grants, budgets, eval gates, event triggers и escalation policy — чтобы агент сам понимал следующий шаг, когда действовать и когда звать человека.
-
Организуешь Spec-Driven разработку и делаешь её прозрачной для команды.
-
Собираешь модуль Harness: память, скиллы, тулы, оркестратор, модели.
-
Гоняешь evals harness-модулей: модификация → бенчмарк → … → прод.
-
Развиваешь инфраструктуру под оркестрацию.
Требования -
Spec-Driven Dev, >3 мес. в проде. Минимум один из: OpenSpec, GStack, GitHub Spec Kit, Kiro. Объясняешь, почему OpenSpec выигрывает на brownfield, а Spec Kit — на greenfield.
-
Memory & mind-maps для агентов. Строил memory layer на чём-то из: gbrain, graphify, mem0, Letta, Zep + Graphiti. Знаешь разницу между flat-vector и temporal knowledge graph.
-
Параллельная оркестрация, >5 агентов одновременно. Гонял один из: Opencode, Cline, Claude Squad, Conductor, Claude Code Agent Teams. Понимаешь worktree isolation, shared task list, single-writer locks.
-
Persistence. Живёшь в tmux (или zellij). Раны переживают SSH-таймауты и ребуты.
Отбор: оффер за 1 встречу
- Покажи на демо-интервью, как ты управляешь агентами: как делаешь спеки понятными себе самому, как не теряешься в планах, как исполняешь. Фидбек сразу.
-
Harnesses. Использовал минимум 2 из: OpenHands, OpenCode, OMA. Можешь сравнить agent loop, tool-API и orchestration model — и объяснить, почему это важно для evals.
-
Стек на surface: TypeScript / React / Postgres. Но стек — не главное.
-
Профиль. Технический вуз, вероятно финалист олимпиад. Стартап-психотип, исследовательский метод. Full commit — без параллельных пет-проектов.