Hub-Spoke, Pipeline, Swarm — какой паттерн выбрать? Сравнение 5 фреймворков, реальные расчёты стоимости и опыт системы из 6 агентов.
4
Паттерна
52%
Экономия
5
Фреймворков
Зачем нужны мультиагентные системы
Мультиагентная система (MAS) — это архитектура, в которой несколько автономных AI-агентов работают совместно, каждый со своей специализацией, инструментами и контекстом.
Агент в контексте LLM — это не просто промпт. Это системный промпт (роль, правила), набор инструментов (API, файлы, браузер), память (краткосрочная + долгосрочная) и логика принятия решений (когда действовать, когда делегировать).
Вместо одного агента с контекстным окном в 200K токенов, забитым всем подряд, вы получаете 5-6 агентов, каждый из которых использует 10-30K токенов максимально эффективно.
Почему 2026 — переломный год
📏Контекст вырос, но эффективность упала Окна до 1M+ у Gemini, 200K у Claude — но качество деградирует при забитом контексте.
💰Топовые модели остаются дорогими Claude Opus 4.6: $5/$25 за миллион токенов. Routing по моделям — необходимость.
🔧Фреймворки созрели LangGraph, CrewAI, AutoGen — production-ready инструменты для оркестрации.
4 архитектурных паттерна
🌟 Hub-Spoke (Координатор + Специалисты)
Самый популярный в enterprise. Центральный агент принимает задачу, декомпозирует и распределяет между специалистами.
┌──── Researcher ────┐
│ │
User → Coordinator ──── Coder ────→ Result
│ │
└──── Writer ────────┘
✅Плюсы Понятная иерархия, легко добавлять специалистов, единая точка контроля.
⚠️Минусы Координатор — single point of failure и bottleneck при масштабировании.
⛓️ Pipeline (Конвейер)
Агенты работают последовательно. Выход одного — вход следующего.
Data → Collector → Analyzer → Writer → Editor → Published
✅Плюсы Простая отладка, предсказуемый поток, изоляция каждого этапа.
⚠️Минусы Линейность — один упавший этап останавливает всю цепочку. Высокая латентность.
🐝 Swarm (Рой)
Децентрализованная архитектура. Агенты действуют автономно, координируются через общее состояние. Нет единого координатора.
✅Плюсы Отказоустойчивость, масштабируемость, нет bottleneck.
⚠️Минусы Сложная отладка, непредсказуемое поведение, трудно гарантировать результат.
🏛️ Hierarchical (Иерархическая)
Многоуровневая структура: CEO → Менеджеры → Исполнители. Каждый уровень делегирует вниз.
Strategic Agent (CEO)
/ | \
Manager A Manager B Manager C
/ \ | / \
Agent1 Agent2 Agent3 Agent4 Agent5
✅Плюсы Масштабируется на сложные проекты, естественная декомпозиция.
⚠️Минусы Overhead на коммуникацию между уровнями, дороже по токенам.
💡 На практике
Чистых паттернов почти не бывает. O'Reilly (февраль 2026): лучшие production-системы используют гибриды — быстрые специалисты параллельно, медленный стратегический агент агрегирует и корректирует курс.
5 фреймворков: сравнение
🚀 CrewAI
Ролевые агенты, 20 строк кода. Лучший для прототипирования. Ограниченная гибкость для нестандартных workflow.
💬 AutoGen
Диалоговая парадигма от Microsoft. Human-in-the-loop из коробки. Слабая масштабируемость.
🔷 LangGraph
Граф состояний, максимальная гибкость. Production-ready + LangSmith мониторинг. Высокий порог входа.
⚡ OpenClaw
Агент как 24/7 daemon. Нативная интеграция с мессенджерами, файловая система как память, субагенты.
🧠 Claude Agent Teams
Нативные возможности Anthropic через tool_use. Не нужен отдельный фреймворк. Привязка к одному провайдеру.
🔀Разные экспертизы Исследователь + кодер + писатель + ревьюер
📦Контекст не помещается Данные из 10 источников не влезут в одно окно
⚡Нужен параллелизм 5 задач одновременно
🛡️Изоляция ошибок Сбой одного агента не ломает остальных
💰Разные модели для разных задач Дорогая для стратегии, дешёвая для рутины
Если ваш системный промпт превышает 2000 слов и содержит инструкции для 3+ типов задач — пора разделять на агентов.
Оркестрация: передача контекста
Главная проблема MAS — как передать нужный контекст без потерь и без раздувания токенов.
📁 File-based
Агент А пишет результат в файл → Агент Б читает. Просто, надёжно, синхронный.
📋 Structured messages
JSON/YAML между агентами. Чёткий контракт: какие поля передаём.
🗄️ Shared state
Общая БД или key-value store. Гибко, но нужна синхронизация.
📝 Summary chain
Каждый агент получает сжатое резюме, не полный вывод. Экономит токены.
🔑 Что работает на практике
Гибрид: файлы для больших данных + структурированные сообщения для метаданных + summary для контекста. Координатор формирует «минимально необходимый контекст» для каждого специалиста.
❌ Главная ошибка
Передавать весь вывод предыдущего агента следующему. Это раздувает контекст и стоимость экспоненциально.
Стоимость: мультиагент дешевле?
Наивная реализация (каждый агент на Opus с полным контекстом) будет в 3-5x дороже. Но оптимизированная система может быть дешевле одного тяжёлого агента.
Стратегии оптимизации
🔀Model routing Стратегия → Opus ($5/$25). Код → Sonnet ($3/$15). Рутина → DeepSeek V3.2 ($0.028). Экономия: 60-80%.
✂️Context minimization Передавать только нужное. Не весь проект, а конкретный файл.
💾Prompt caching До 90% экономии на входных токенах при повторяющихся промптах.
🔄Параллелизм 5 дешёвых агентов параллельно быстрее и дешевле 1 дорогого последовательно.
Координатор: принимает задачи, декомпозирует, спавнит субагентов, отслеживает прогресс.
🔍 Research
Веб-поиск, анализ данных, подготовка фактуры.
✍️ Writer
Создание контента на основе исследований.
💻 Code
Разработка, деплой, дебаг.
🔎 Review
Проверка качества, code review, факт-чекинг.
🎨 Creative
Визуалы, обложки, креативные идеи.
Ключевые решения
🔀Model routing по задачам Координатор — топовая модель. Исследования — средняя. Рутинное написание — дешёвая.
📁Файлы как память Каждый агент пишет результат в файл. Следующий читает только нужные. Нет раздувания контекста.
📋Pipeline-трекер JSON-файл с состоянием каждой цепочки. Автоперезапуск при зависании >15 минут.
Чему научились
4 урока из практики
1. Субагенты НЕ должны спавнить субагентов. Максимум 2 уровня вложенности. 2. Каждый субагент эфемерен — сделал дело, записал результат, умер. 3. Контекст в промпте = минимально необходимый. Не весь проект. 4. Без мониторинга pipeline зависают незаметно. Трекинг критичен.
Best practices и антипаттерны
✅ Делайте
1️⃣Начните с одного агента Найдите bottleneck (контекст, скорость, качество), потом выделяйте специалиста.
2️⃣Чёткие контракты Что получает на вход, что отдаёт на выход, что НЕ является ответственностью.
3️⃣Fail gracefully Логирование → retry → уведомление человеку. НЕ падать всей системой.
4️⃣Human-in-the-loop Автоматизируйте рутину, оставьте approval для отправки сообщений, финансов, удаления.
5️⃣Версионирование промптов Системные промпты — это код. Храните, версионируйте, ревьюьте.
❌ Не делайте
🤖 God Agent
Промпт на 5000 слов, 50 инструментов. Деградация качества, высокая стоимость.
💬 Chatty Agents
Пересылка полного контекста на каждом шаге. Токены горят без пользы.
♾️ Infinite Delegation
A делегирует B → C → D… Ни один не работает. Максимум 2 уровня.
⏳ Premature MAS
5 агентов для задачи, которую один решает за 30 секунд.
🏎️ Same Model Everywhere
Opus для форматирования JSON. Как ездить на Ferrari за хлебом.
Главный вывод
Мультиагентные системы в 2026 — не хайп, а инженерная необходимость для сложных AI-приложений. Но подход должен быть прагматичным:
1️⃣Начните с одного агента и выделяйте специалистов по мере роста сложности
2️⃣Выберите паттерн под задачу, а не «самый модный»
3️⃣Model routing — главный рычаг оптимизации стоимости
4️⃣Мониторинг и трекинг — не опция, а фундамент
5️⃣Файлы > Messages для межагентного контекста
Лучшая мультиагентная система — та, которая решает задачу. Не та, которая «самая архитектурная».