DeerFlow：沙箱化 SuperAgent 调度框架，长时任务自主处理

DeerFlow 是 ByteDance 开源的 SuperAgent 调度框架（harness），专为处理从数分钟到数小时的复杂任务而设计。它通过沙箱化执行、持久化记忆、工具与技能分发，以及子代理（sub-agents）协作，实现对研究、编码和创作等长时任务的完全自主管理。与传统单代理聊天不同，DeerFlow 提供了一个完整的运行时环境，让代理像拥有独立 “计算机” 一样工作，避免上下文膨胀和状态丢失。

SuperAgent 调度架构的核心观点

DeerFlow 的核心在于其基于 LangGraph 的多代理编排机制。主代理（lead agent）负责任务分解、子代理生成与结果合成，而子代理则并行处理子任务。这种设计特别适合多小时任务，例如深度研究报告生成或自动化数据管道构建。证据显示，在 GitHub README 中，DeerFlow 强调 “一个 harness，多双手”，主代理可动态生成数十个子代理，每个专注于特定角度，如文献调研或代码实现 [1]。

落地参数：

代理图配置：在 config.yaml 中定义模型，如 models: - name: gpt-4o, use: langchain_openai:ChatOpenAI, max_tokens: 128000（推荐长上下文模型，支持 100k+ tokens）。
子代理生成阈值：默认当任务复杂度 > 3 步时自动 spawn，监控 subagent_count ≤ 20，避免爆炸式增长。
终止条件：子代理输出需满足 JSON schema，如 {"status": "complete", "artifacts": ["/outputs/report.md"]}。

沙箱化执行：代理的 “私人计算机”

沙箱是 DeerFlow 的杀手锏，提供隔离的文件系统和执行环境，支持本地、Docker 或 Kubernetes 模式。代理可在沙箱内读写文件、执行 bash/Python，支持用户上传文件处理。例如，上传 Excel 后，代理可分析并输出可视化图表，所有操作审计化、无跨会话污染。

证据：沙箱路径结构为 /mnt/user-data/uploads/（用户文件）、/mnt/workspace/（工作区）、/mnt/outputs/（交付物）。Docker 模式下，每个任务独占容器，K8s 通过 provisioner 服务扩展 [1]。

可落地清单：

Docker 沙箱启动：make docker-init && make docker-start，访问 localhost:2026。
K8s 模式参数：sandbox: {use: src.community.aio_sandbox:AioSandboxProvider, provisioner_url: "http://provisioner:8000"}，pod TTL=1h，资源限 cpu: 2, memory: 4Gi。
安全阈值：bash 执行白名单 allowed_cmds: ["ls", "cat", "python"]，超时 300s / 命令。
回滚策略：失败 checkpoint 回退到上个子任务，checkpoint_backend: postgres。

持久记忆与上下文工程

长时任务易遭上下文窗口限制，DeerFlow 通过持久记忆和隔离上下文解决。长期记忆本地存储用户偏好、历史知识；子代理上下文隔离，避免干扰；动态总结将完成子任务 offload 到文件系统。

证据：记忆跨会话持久，适应写作风格等；上下文工程包括 summarization 和 compression，支持多小时运行而不爆窗 [1]。

参数配置：

记忆存储：memory: {type: local_filesystem, path: ./memories/}，嵌入模型 text-embedding-3-small。
总结阈值：当 tokens > 80% 容量时触发，保留关键 artifacts。
监控点：context_length、memory_recall_hits（>90% 命中率），异常时降级到 in-memory。

工具与技能分发：扩展 “几乎任何事”

Skills 是 Markdown 定义的工作流模块，按需加载；Tools 包括 web search、file ops、bash。自定义技能放 /mnt/skills/custom/，MCP 服务器集成外部 API。

证据：内置 skills 如 research、report-generation、slide-creation，支持图像 / 视频生成 [1]。

落地清单：

技能加载：skills: {public: true, custom: ["my-skill/SKILL.md"]}。
工具参数：Tavily API key，tools: {web_search: {max_results: 10}}。
分发策略：主代理根据计划 dispatch，优先并行工具调用。
性能优化：懒加载 skills，token 预算 per skill ≤ 4k。

部署与监控实战

快速启动：clone repo → uv sync → 编辑 config/.env → make docker-start。嵌入式使用：from src.client import DeerFlowClient; client.chat(task)。

监控清单：

指标：任务时长（<2h / 任务）、成功率 (>95%)、tokens / 任务 (<1M)、subagents / 任务 (5-15)。
告警：sandbox OOM → 增 mem limit；模型 hallucination → 切换 claude-3.5-sonnet。
回滚：版本 pin langgraph==0.1.x，测试集覆盖 deep research 示例。

DeerFlow 的 harness 架构让 SuperAgent 从 “聊天” 变 “执行者”，适用于 R&D 自动化。相比 AutoGPT 等，它的文件系统 + checkpointing 更稳健长跑。

资料来源： [1] https://github.com/bytedance/deer-flow (官方 README)。 [2] https://deerflow.tech (官网演示)。

（正文字数：约 1250 字）