DeerFlow 2.0 是 ByteDance 开源的 SuperAgent 框架,重构自深度研究工具,演变为完整的代理运行时(harness),专为长时复杂任务设计,如多小时的研究报告生成、代码编写或内容创作。它通过沙箱、记忆、工具技能与子代理的紧密编排,实现可靠的并行执行与上下文管理,避免传统代理的幻觉与上下文溢出问题。
核心观点在于:单一代理难以处理小时级任务,而 DeerFlow 的 harness 架构将任务分解为子代理协作,每个子代理拥有独立沙箱与上下文,通过文件系统与总结机制聚合结果。这种设计证据于其基于 LangGraph 的多代理工作流,能动态 spawn 子代理,并支持 Docker/K8s 隔离执行,确保安全性与可审计性。
沙箱与文件系统:代理的 “虚拟计算机”
DeerFlow 为每个任务分配独立 Docker 容器沙箱,提供持久文件系统,支持读写、bash 执行与代码运行。关键路径包括:
/mnt/user-data/uploads/:用户上传文件。/mnt/user-data/workspace/:代理工作目录。/mnt/user-data/outputs/:最终输出。/mnt/skills/public/:内置技能,如 research/SKILL.md、report-generation/SKILL.md。
落地参数:
- sandbox.use:在 config.yaml 中配置为
src.community.aio_sandbox:AioSandboxProvider,启用 provisioner_url 指向 K8s provisioner 时自动启动 provisioner 服务。 - Docker 模式:
make docker-init预拉镜像,make docker-start启动服务,支持本地 / Docker/K8s 三种模式。 - 资源限额:容器 CPU 2 cores、内存 8GB、超时 3600s(小时级任务),通过 Docker compose 或 K8s yaml 设置
resources.limits.cpu: 2000m、resources.limits.memory: 8Gi。 - 监控点:日志追踪文件 I/O 与 bash 输出,Prometheus 指标如
sandbox_exec_duration_seconds,阈值 >300s 告警;回滚策略:若沙箱崩溃,重启容器并从 workspace 恢复状态。
推荐集成 agent-infra/sandbox,提供浏览器、shell、VSCode 等一站式环境,确保代理如真人般操作。
记忆与上下文工程:长时任务的连续性
传统代理遗忘严重,DeerFlow 引入长短期记忆:
- 短期:会话内总结子任务,offload 到文件系统,压缩无关上下文。
- 长期:跨会话持久化用户 profile、偏好与知识库,本地存储。
证据:隔离子代理上下文,避免主代理干扰;总结机制支持 100k+ 令牌模型。
参数配置:
- 模型选择:config.yaml 中
models: [{name: gpt-4o, model: gpt-4o, max_tokens: 128000, temperature: 0.3}],优先长上下文模型如 GPT-4o、Gemini 1.5 Pro。 - 记忆阈值:总结频率每 5 子任务,压缩率 50%,监控
context_length / max_tokens > 0.8时强制总结。 - 优化:启用多模型路由,复杂规划用 Claude-3.5-sonnet,执行用 DeepSeek-Coder。
工具技能与子代理:动态编排
Skills 是 Markdown 定义的工作流,仅按需加载,保持上下文精简。内置技能覆盖研究、幻灯片生成、网页构建;工具包括 web search、file ops、bash。
子代理机制:主代理规划后 spawn 子代理,并行探索(如研究多角度),返回结构化结果。
落地清单:
- 配置技能:编辑
/mnt/skills/custom/your-skill/SKILL.md,包含 workflow、best practices。 - 工具扩展:MCP server 集成自定义工具,config 中
mcp_servers: [{url: http://mcp:8000}]。 - 子代理参数:
max_subagents: 10,parallelism: true,终止条件completion_criteria: structured_output。 - 部署命令:
访问 http://localhost:2026。git clone https://github.com/bytedance/deer-flow.git cd deer-flow cp config.example.yaml config.yaml # 编辑模型/API key echo "OPENAI_API_KEY=sk-..." > .env make docker-init && make docker-start - 监控与调优:
指标 阈值 行动 task_duration >2h 分解粒度 subagent_fail_rate >20% 技能回滚 token_usage >80% 总结增强 sandbox_restart >3 / 任务 资源扩容
实践案例:多小时代码项目
例如,构建数据仪表盘:主代理规划(研究需求→设计 UI→编码→测试),spawn 子代理(数据采集、图表生成、部署),沙箱内执行 pip install、pygame 测试,输出 zip 包。整个过程 1-3 小时,证据于 demo 视频显示 60FPS 稳定运行。
风险限:高资源消耗(监控 GPU/CPU),模型幻觉(用 structured output),安全(沙箱隔离)。
DeerFlow 的 harness 架构标志 Agent 从聊天向生产力工具转型,提供可落地参数确保小时级任务可靠。
资料来源:
(正文字数约 950)