DeerFlow SuperAgent 框架：沙箱、记忆、工具技能与子代理的长任务编排实践

DeerFlow 2.0 是 ByteDance 开源的 SuperAgent 框架，重构自深度研究工具，演变为完整的代理运行时（harness），专为长时复杂任务设计，如多小时的研究报告生成、代码编写或内容创作。它通过沙箱、记忆、工具技能与子代理的紧密编排，实现可靠的并行执行与上下文管理，避免传统代理的幻觉与上下文溢出问题。

核心观点在于：单一代理难以处理小时级任务，而 DeerFlow 的 harness 架构将任务分解为子代理协作，每个子代理拥有独立沙箱与上下文，通过文件系统与总结机制聚合结果。这种设计证据于其基于 LangGraph 的多代理工作流，能动态 spawn 子代理，并支持 Docker/K8s 隔离执行，确保安全性与可审计性。

沙箱与文件系统：代理的 “虚拟计算机”

DeerFlow 为每个任务分配独立 Docker 容器沙箱，提供持久文件系统，支持读写、bash 执行与代码运行。关键路径包括：

/mnt/user-data/uploads/：用户上传文件。
/mnt/user-data/workspace/：代理工作目录。
/mnt/user-data/outputs/：最终输出。
/mnt/skills/public/：内置技能，如 research/SKILL.md、report-generation/SKILL.md。

落地参数：

sandbox.use：在 config.yaml 中配置为 src.community.aio_sandbox:AioSandboxProvider，启用 provisioner_url 指向 K8s provisioner 时自动启动 provisioner 服务。
Docker 模式：make docker-init 预拉镜像，make docker-start 启动服务，支持本地 / Docker/K8s 三种模式。
资源限额：容器 CPU 2 cores、内存 8GB、超时 3600s（小时级任务），通过 Docker compose 或 K8s yaml 设置 resources.limits.cpu: 2000m、resources.limits.memory: 8Gi。
监控点：日志追踪文件 I/O 与 bash 输出，Prometheus 指标如 sandbox_exec_duration_seconds，阈值 >300s 告警；回滚策略：若沙箱崩溃，重启容器并从 workspace 恢复状态。

推荐集成 agent-infra/sandbox，提供浏览器、shell、VSCode 等一站式环境，确保代理如真人般操作。

记忆与上下文工程：长时任务的连续性

传统代理遗忘严重，DeerFlow 引入长短期记忆：

短期：会话内总结子任务，offload 到文件系统，压缩无关上下文。
长期：跨会话持久化用户 profile、偏好与知识库，本地存储。

证据：隔离子代理上下文，避免主代理干扰；总结机制支持 100k+ 令牌模型。

参数配置：

模型选择：config.yaml 中 models: [{name: gpt-4o, model: gpt-4o, max_tokens: 128000, temperature: 0.3}]，优先长上下文模型如 GPT-4o、Gemini 1.5 Pro。
记忆阈值：总结频率每 5 子任务，压缩率 50%，监控 context_length / max_tokens > 0.8 时强制总结。
优化：启用多模型路由，复杂规划用 Claude-3.5-sonnet，执行用 DeepSeek-Coder。

工具技能与子代理：动态编排

Skills 是 Markdown 定义的工作流，仅按需加载，保持上下文精简。内置技能覆盖研究、幻灯片生成、网页构建；工具包括 web search、file ops、bash。

子代理机制：主代理规划后 spawn 子代理，并行探索（如研究多角度），返回结构化结果。

落地清单：

配置技能：编辑 /mnt/skills/custom/your-skill/SKILL.md，包含 workflow、best practices。
工具扩展：MCP server 集成自定义工具，config 中 mcp_servers: [{url: http://mcp:8000}]。
子代理参数：max_subagents: 10，parallelism: true，终止条件 completion_criteria: structured_output。

部署命令：

git clone https://github.com/bytedance/deer-flow.git
cd deer-flow
cp config.example.yaml config.yaml  # 编辑模型/API key
echo "OPENAI_API_KEY=sk-..." > .env
make docker-init && make docker-start

访问 http://localhost:2026。

监控与调优：

指标阈值行动

task_duration >2h 分解粒度

subagent_fail_rate >20% 技能回滚

token_usage >80% 总结增强

sandbox_restart >3 / 任务资源扩容

指标	阈值	行动
task_duration	>2h	分解粒度
subagent_fail_rate	>20%	技能回滚
token_usage	>80%	总结增强
sandbox_restart	>3 / 任务	资源扩容

实践案例：多小时代码项目

例如，构建数据仪表盘：主代理规划（研究需求→设计 UI→编码→测试），spawn 子代理（数据采集、图表生成、部署），沙箱内执行 pip install、pygame 测试，输出 zip 包。整个过程 1-3 小时，证据于 demo 视频显示 60FPS 稳定运行。

风险限：高资源消耗（监控 GPU/CPU），模型幻觉（用 structured output），安全（沙箱隔离）。

DeerFlow 的 harness 架构标志 Agent 从聊天向生产力工具转型，提供可落地参数确保小时级任务可靠。

资料来源：

（正文字数约 950）