Hotdry.
ai-systems

DeerFlow:沙箱化 SuperAgent 调度框架,长时任务自主处理

通过沙箱执行、持久记忆与工具/技能调度,DeerFlow 实现多代理对复杂多小时研究、编码、创作任务的自主编排。

DeerFlow 是 ByteDance 开源的 SuperAgent 调度框架(harness),专为处理从数分钟到数小时的复杂任务而设计。它通过沙箱化执行、持久化记忆、工具与技能分发,以及子代理(sub-agents)协作,实现对研究、编码和创作等长时任务的完全自主管理。与传统单代理聊天不同,DeerFlow 提供了一个完整的运行时环境,让代理像拥有独立 “计算机” 一样工作,避免上下文膨胀和状态丢失。

SuperAgent 调度架构的核心观点

DeerFlow 的核心在于其基于 LangGraph 的多代理编排机制。主代理(lead agent)负责任务分解、子代理生成与结果合成,而子代理则并行处理子任务。这种设计特别适合多小时任务,例如深度研究报告生成或自动化数据管道构建。证据显示,在 GitHub README 中,DeerFlow 强调 “一个 harness,多双手”,主代理可动态生成数十个子代理,每个专注于特定角度,如文献调研或代码实现 [1]。

落地参数:

  • 代理图配置:在 config.yaml 中定义模型,如 models: - name: gpt-4o, use: langchain_openai:ChatOpenAI, max_tokens: 128000(推荐长上下文模型,支持 100k+ tokens)。
  • 子代理生成阈值:默认当任务复杂度 > 3 步时自动 spawn,监控 subagent_count ≤ 20,避免爆炸式增长。
  • 终止条件:子代理输出需满足 JSON schema,如 {"status": "complete", "artifacts": ["/outputs/report.md"]}

沙箱化执行:代理的 “私人计算机”

沙箱是 DeerFlow 的杀手锏,提供隔离的文件系统和执行环境,支持本地、Docker 或 Kubernetes 模式。代理可在沙箱内读写文件、执行 bash/Python,支持用户上传文件处理。例如,上传 Excel 后,代理可分析并输出可视化图表,所有操作审计化、无跨会话污染。

证据:沙箱路径结构为 /mnt/user-data/uploads/(用户文件)、/mnt/workspace/(工作区)、/mnt/outputs/(交付物)。Docker 模式下,每个任务独占容器,K8s 通过 provisioner 服务扩展 [1]。

可落地清单:

  1. Docker 沙箱启动make docker-init && make docker-start,访问 localhost:2026
  2. K8s 模式参数sandbox: {use: src.community.aio_sandbox:AioSandboxProvider, provisioner_url: "http://provisioner:8000"},pod TTL=1h,资源限 cpu: 2, memory: 4Gi
  3. 安全阈值:bash 执行白名单 allowed_cmds: ["ls", "cat", "python"],超时 300s / 命令。
  4. 回滚策略:失败 checkpoint 回退到上个子任务,checkpoint_backend: postgres

持久记忆与上下文工程

长时任务易遭上下文窗口限制,DeerFlow 通过持久记忆和隔离上下文解决。长期记忆本地存储用户偏好、历史知识;子代理上下文隔离,避免干扰;动态总结将完成子任务 offload 到文件系统。

证据:记忆跨会话持久,适应写作风格等;上下文工程包括 summarization 和 compression,支持多小时运行而不爆窗 [1]。

参数配置:

  • 记忆存储memory: {type: local_filesystem, path: ./memories/},嵌入模型 text-embedding-3-small
  • 总结阈值:当 tokens > 80% 容量时触发,保留关键 artifacts。
  • 监控点context_lengthmemory_recall_hits(>90% 命中率),异常时降级到 in-memory。

工具与技能分发:扩展 “几乎任何事”

Skills 是 Markdown 定义的工作流模块,按需加载;Tools 包括 web search、file ops、bash。自定义技能放 /mnt/skills/custom/,MCP 服务器集成外部 API。

证据:内置 skills 如 research、report-generation、slide-creation,支持图像 / 视频生成 [1]。

落地清单:

  1. 技能加载skills: {public: true, custom: ["my-skill/SKILL.md"]}
  2. 工具参数:Tavily API key,tools: {web_search: {max_results: 10}}
  3. 分发策略:主代理根据计划 dispatch,优先并行工具调用。
  4. 性能优化:懒加载 skills,token 预算 per skill ≤ 4k。

部署与监控实战

快速启动:clone repo → uv sync → 编辑 config/.env → make docker-start。嵌入式使用:from src.client import DeerFlowClient; client.chat(task)

监控清单:

  • 指标:任务时长(<2h / 任务)、成功率 (>95%)、tokens / 任务 (<1M)、subagents / 任务 (5-15)。
  • 告警:sandbox OOM → 增 mem limit;模型 hallucination → 切换 claude-3.5-sonnet。
  • 回滚:版本 pin langgraph==0.1.x,测试集覆盖 deep research 示例。

DeerFlow 的 harness 架构让 SuperAgent 从 “聊天” 变 “执行者”,适用于 R&D 自动化。相比 AutoGPT 等,它的文件系统 + checkpointing 更稳健长跑。

资料来源: [1] https://github.com/bytedance/deer-flow (官方 README)。 [2] https://deerflow.tech (官网演示)。

(正文字数:约 1250 字)

查看归档