Инженерия 12 мин чтения

Аудит мультиагентной системы: с 13 до 6 — как мы оптимизировали команду ИИ

Аудит мультиагентной ИИ-системы

Мы построили систему из 13 ИИ-агентов. Реально работали только 4. Вот полный аудит — что мы узнали из OpenAI Swarm, CrewAI, AutoGen и LangGraph, и как пришли к компактной команде из 6 агентов.

13
Агентов до
6
Агентов после
9
Балласт
~40%
Снижение затрат

Проблема: неконтролируемый рост агентов

Всё началось невинно. Нужен агент для контента. Потом для стратегии. Потом SEO, YouTube, «второй мозг», саморазвитие, отладка... Не успели оглянуться — в системе OpenClaw уже 13 агентов. Реальность? Работали только 4.

🔑 Ключевой вывод: Создавать агента под каждую идею — антипаттерн №1 в мультиагентных системах. Консенсус индустрии: 3–7 агентов — оптимальный диапазон.

Исследование индустрии: что реально работает

Прежде чем резать, мы изучили все основные мультиагентные фреймворки — чтобы понять, к чему пришла индустрия.

OpenAI Swarm → Agents SDK

Легковесный паттерн «передачи эстафеты» — агенты передают управление друг другу напрямую. Обычно 2–5 агентов. Консенсус Reddit: лучший вариант для продакшена благодаря простоте и предсказуемости. Нет встроенного управления состоянием, не подходит для долгих процессов.

CrewAI

Ролевая архитектура с YAML-конфигами. Обычно 3–7 агентов на «экипаж». 1,7 млрд обработанных воркфлоу. Критическая находка: точность делегирования всего 33% без базы знаний (73% с ней). Экипажи нужно собирать под задачу, а не держать постоянно.

Microsoft AutoGen

Диалоговая модель с отличной интеграцией человека в процесс. 2–10 агентов, общающихся через асинхронные сообщения. Тяжёлая настройка — избыточна для простых задач.

LangGraph

Графовая архитектура с явным потоком управления, чекпоинтами и отладкой «путешествием во времени». Общее состояние через единое хранилище. Крутая кривая обучения, но отлично подходит для сложных воркфлоу.

📊 Универсальные принципы: Меньше агентов = лучше. У каждого агента — чёткая, узкая роль. Общее состояние через файлы/БД работает отлично. Человек в процессе — обязателен. Для рутины — дешёвые модели.

Аудит: все 13 агентов

Мы оценили каждого агента по трём критериям: Активен ли он? Есть ли у него уникальная роль? Оправдана ли стоимость модели?

✅ Оставлены

🤖

Main (Оркестратор) ОСТАВИТЬ

Центральный мозг. Занимается всем — от контента до DevOps, порождает субагентов, управляет канбаном. Модель: Opus 4.6 — оправдана сложностью оркестрации.

💀

DeathScore (Разработка продукта) ОСТАВИТЬ

Полный цикл разработки DeathScore.ai — нашего основного продукта. Модель: Opus 4.6 — оправдана для кодинга и продуктовых решений.

🏢

ProStudio Ops (Мониторинг команды) ОСТАВИТЬ → понизить модель

Мониторит командные чаты, извлекает задачи. Был на Opus 4.6 ($5/$25 за M токенов) — переключили на Sonnet 4.5 ($3/$15). Парсинг чатов не требует самой дорогой модели.

📡

TeleGrow (Скаут лидогенерации) ОСТАВИТЬ

Мониторинг Telegram-чатов 24/7 для лидогенерации. Модель: Kimi K2.5 ($0.60/M) — адекватно дёшево для мониторинга.

⏸️ Заморожены (активируются по необходимости)

🔍

SEO ЗАМОРОЗИТЬ

SEO — периодическая работа, а не непрерывный процесс. Субагенты Main справляются. Активируем, когда появится реальный поток SEO-задач.

ProTechBot (Лид-магнит) ЗАМОРОЗИТЬ

Telegram-бот для лид-магнита мероприятия Sold Out. Код написан, но трафика пока нет. Заморожен до запуска маркетинга.

❌ Удалены (7 агентов)

✍️

Content УДАЛИТЬ

Main уже генерирует весь контент через субагентов. Дублирующая роль.

🎬

Production AI УДАЛИТЬ

Нет чёткого назначения. Был на Opus 4.6 — дорого для неактивного агента с неопределённой целью.

📊

Strategy, YouTube, Brain, SelfGrowth, Debug УДАЛИТЬ

Все пустые или дублирующие возможности Main. Strategy = разговор с Main. YouTube = субагент для контента. Brain = MEMORY.md. Debug = функция, а не агент.

Фреймворк принятия решений

Правило: постоянный агент оправдан ТОЛЬКО когда:
  1. У него есть свой Telegram-бот / канал (нужно постоянное присутствие)
  2. Он работает как автономный демон (мониторинг 24/7)
  3. Он управляет отдельным продуктом с большой кодовой базой

Всё остальное → субагенты. Дешевле, проще, никогда не забудутся.

Целевая архитектура

                    ┌─────────────┐
                    │  Человек 👨 │
                    │  (Telegram)  │
                    └──────┬──────┘
                           │
                ┌──────────▼──────────┐
                │   🤖 MAIN (Opus)    │
                │   Оркестратор       │◄── cron + heartbeat
                │   + субагенты       │
                └──┬───┬───┬─────────┘
                   │   │   │
      ┌────────────┘   │   └────────────┐
      ▼                ▼                ▼
┌───────────┐  ┌───────────┐  ┌───────────┐
│💀 Death-  │  │🏢 Ops     │  │📡 Tele-   │
│  Score    │  │ Sonnet4.5 │  │  Grow     │
│  Opus 4.6 │  │ Командные │  │  K2.5     │
│  Продукт  │  │ чаты      │  │  Лиды     │
└───────────┘  └───────────┘  └───────────┘

  ⏸️ Заморожены: SEO (Pro) | ProTechBot (K2.5)

Влияние на затраты

❌ До (13 агентов)

  • 3 агента на Opus 4.6 ($5/$25)
  • 9 агентов-балласт, занимающих конфиг
  • Оценка ~$15–25/день

✅ После (6 агентов)

  • 2 агента на Opus, 1 на Sonnet, 1 на K2.5
  • Нулевой балласт
  • Оценка ~$10–15/день

Ключевые выводы

  1. «Агент на каждую идею» — антипаттерн. Все фреймворки (CrewAI, Swarm, AutoGen) сходятся на 3–7 агентах как оптимуме.
  2. Субагенты лучше постоянных агентов для разовых задач. Они дешевле, изолированы и автоматически архивируются.
  3. Подбирайте модель под задачу. Opus для оркестрации и кодинга. Sonnet для парсинга чатов. K2.5 для мониторинга. Не гоняйте Opus на всём подряд.
  4. Нет задачи = нет агента. Если агент неактивен неделями, ему не нужно существовать.
  5. Чёткие границы ролей важнее количества агентов. Четыре сфокусированных агента превосходят тринадцать размытых.
💡 Философия: Цель не в «больше агентов», а в «правильных агентах». Постоянный агент — это непрерывный процесс. Субагент — это задача. Знайте разницу.