Hotdry.

Article

多Agent共享记忆架构:分布式状态同步与知识沉淀的工程实践

解析Hivemind的多Agent共享记忆系统,从Capture到Propagate的四阶段架构,提供分布式状态同步协议设计与跨Agent上下文继承的落地参数。

2026-06-10ai-systems

问题背景:Agent 孤岛与知识断层

当团队内部多个工程师各自使用 Claude Code、Cursor 或 Codex 时,一个典型场景反复出现:资深工程师的 Agent 周一刚解决了一个棘手的迁移问题,周二 junior 工程师的 Agent 面对相似任务时却要从零开始。每个 Agent 会话都是独立的上下文窗口,知识无法跨会话、跨人员、跨工具沉淀。

Hivemind 的核心洞察在于:Agent 的能力不应该随会话结束而消失,而应该像代码一样被版本化、共享和复用。这套由 ActiveLoopAI 开源的系统,通过 "一个大脑服务所有 Agent" 的架构,实现了跨工具、跨团队的知识沉淀。

四阶段架构:Capture → Codify → Propagate → Compound

Capture:结构化追踪采集

Hivemind 在每个支持的 Agent 生命周期中植入钩子(hooks),捕获三类关键数据:

  • User prompts:用户输入的每条指令
  • Tool calls:Agent 调用的工具名称及完整参数
  • Tool responses:工具返回的原始输出
  • Assistant responses:Agent 的最终响应

这些数据以结构化 trace 的形式写入 Deeplake 的 sessions 表。不同于简单的日志记录,trace 保留了完整的调用链关系,使得后续可以重建 "为了得到这个答案,Agent 经历了哪些思考步骤"。

关键配置参数

HIVEMIND_CAPTURE=true              # 开启采集
HIVEMIND_CAPTURE_ONLY_CLI=true     # 仅采集CLI会话,跳过SDK调用
HIVEMIND_SESSIONS_TABLE=sessions   # 存储表名

Codify:模式识别与技能编码

采集只是第一步,真正的价值在于从海量 traces 中提取可复用的模式。Hivemind 的 skillify 后台 worker 在会话结束时触发,执行以下逻辑:

  1. 范围扫描:读取当前 workspace 内指定时间窗口的 traces(默认团队可见)
  2. 模式挖掘:使用轻量级模型(如 Claude Haiku)分析 traces,识别重复出现的解决模式
  3. 技能编码:将识别出的模式写入 SKILL.md 文件,存储于项目目录的 .claude/skills/<name>/

一个典型的 SKILL.md 包含:问题描述、前置条件、解决步骤、验证方法、常见陷阱。这些文件本质上是对团队最佳实践的显式编码。

调优参数

HIVEMIND_SKILLIFY_EVERY_N_TURNS=20  # 每N轮Agent对话触发一次挖掘
                                    # 值越低:更频繁挖掘,成本略增
                                    # 值越高:减少噪音,可能遗漏短会话模式

Propagate:实时能力传播

编码后的技能需要被注入到每个 Agent 的上下文中才能生效。Hivemind 通过多种机制实现跨 Agent 传播:

Agent 类型 传播机制 注入时机
Claude Code Marketplace 插件 SessionStart
Codex hooks.json beforeSubmitPrompt
Cursor hooks.json 1.7+ sessionStart
Hermes config.yaml + MCP server pre_llm_call
pi AGENTS.md + 扩展 API session_start

所有机制的核心目标一致:在 Agent 开始处理用户输入前,将当前 workspace 可用的 skills 和 rules 注入到系统提示中。这确保了 "上周 senior 的 Agent 学会的迁移模式,本周 junior 的 Agent 开箱即用"。

Compound:复合效应与网络效应

随着使用时长增加,Hivemind 产生复合收益:

  • 知识网络:traces 不仅存储文本,还构建代码库图谱(文件、符号、导入关系、调用边)
  • 检索增强:搜索 "我们在哪里处理 auth" 时,返回的是团队 Agent 实际触碰过的文件,而非所有含 auth 字符串的文件
  • 成本优化:在 LoCoMo 长上下文记忆基准测试中,Hivemind 相比无记忆基线实现了 25% 成本降低、1.7 倍 token 减少、31% 轮次减少

分布式状态同步协议设计

虚拟文件系统层

Hivemind 在 ~/.deeplake/memory/ 路径上实现了一个虚拟文件系统(VFS),通过 SQL 表支撑文件操作。这个设计的精妙之处在于:Agent 以为自己在读写本地文件,实际上是在与分布式存储交互

VFS 路径编码了数据结构:

~/.deeplake/memory/
  ├── summaries/           # AI生成的会话摘要
  ├── skills/              # 团队共享技能
  ├── rules/               # 跨Agent团队规则
  ├── goal/<owner>/<status>/<uuid>.md   # 个人/团队目标
  └── kpi/<goal_id>/<kpi-slug>.md       # 可量化指标

状态转换通过文件移动完成:mv goal/alice/opened/xxx.md goal/alice/in_progress/xxx.md 即表示目标状态从 "已创建" 变为 "进行中"。

混合检索策略

Hivemind 的检索层采用 lexical + semantic 的混合策略:

  • 默认模式:BM25 词法检索,零依赖、低延迟
  • 增强模式:本地嵌入 daemon(nomic-embed-text-v1.5,约 600MB)提供语义检索

语义检索开启后,系统会同时计算查询的 embedding,在向量空间中寻找相似 traces。当 embedding 服务不可用时,系统优雅降级到纯 BM25,不会中断服务。

hivemind embeddings install    # 启用语义检索
HIVEMIND_EMBEDDINGS=false      # 强制词法模式

多租户隔离

在团队级部署中,数据隔离通过以下机制保证:

  1. Workspace 边界:每个 workspace 拥有独立的表空间和索引
  2. 行级隔离:sessions 表按 workspace_id 分区,查询自动附加过滤条件
  3. 加密传输与存储:TLS 传输,AES-256 静态加密
  4. BYOC 支持:可指向自有 GCS、Azure Blob、S3 或本地兼容存储

可落地的工程参数清单

基于 Hivemind 的架构设计,以下是可直接应用的配置参数:

采集控制

HIVEMIND_CAPTURE=true
HIVEMIND_TABLE=memory
HIVEMIND_SESSIONS_TABLE=sessions
HIVEMIND_MEMORY_PATH=~/.deeplake/memory

技能挖掘调优

HIVEMIND_SKILLIFY_EVERY_N_TURNS=20   # 短会话密集型团队可降至10
                                     # 长会话稀疏型团队可升至50

检索配置

HIVEMIND_EMBEDDINGS=true              # 需要600MB本地存储

隐私与合规

HIVEMIND_CAPTURE=false                # 单会话只读模式

团队规则注入

hivemind rules add "no DROP TABLE on prod creds"
hivemind rules list                   # 查看生效规则

风险与限制

  1. 数据可见性:同一 workspace 的所有成员可读取所有 traces,这是设计特性而非缺陷。需要团队级信任基础。

  2. 存储成本:长期运行的团队会积累大量 traces,需规划存储生命周期策略。

  3. 技能质量:自动编码的 skills 可能存在偏差,关键技能建议人工 review 后再推广。

  4. Agent 兼容性:目前仅支持特定 Agent 生态(Claude Code、Codex、Cursor 等),其他 Agent 需要自行实现 hooks。

结语

Hivemind 的架构设计揭示了一个趋势:Agent 正在从工具演变为团队的知识节点。通过 Capture-Codify-Propagate-Compound 的四阶段循环,团队可以将分散的 Agent 会话转化为结构化的组织记忆。这种多 Agent 共享记忆架构不仅降低了重复解决相同问题的成本,更重要的是建立了 "团队智慧" 持续沉淀的机制。

对于正在多 Agent 环境中工作的团队,建议从开启 capture 和设置基础 rules 开始,逐步引入 skillify 和语义检索,最终构建起属于团队的分布式 Agent 记忆网络。

资料来源

ai-systems

内容声明:本文无广告投放、无付费植入。

如有事实性问题,欢迎发送勘误至 i@hotdrydog.com