2025年10月08日 ai-systems

OpenAI Agents Python 中的图执行编排多代理工作流

利用手递和代码链式实现多代理协作，支持动态任务分解、共享工具访问和状态传播，实现可扩展的 AI 协作系统。

内容加载中...

在构建复杂 AI 系统时，多代理协作是实现高效任务处理的關鍵。OpenAI Agents Python SDK 通过手递（handoffs）机制和代码级编排，提供了一种类似于图执行的 orchestration 方式。这种方法将代理视为图的节点，手递作为边，实现动态任务分解和状态流动，避免了传统线性流程的刚性限制。

首先，理解图执行的核心在于代理间的动态路由。不同于静态脚本，图执行允许代理根据当前上下文自主决定下一步行动。例如，一个研究代理可以手递给写作代理来生成报告。这种动态性源于 LLM 的推理能力：在代理配置中，通过 instructions 指导 LLM 识别任务边界，并使用 handoffs 工具调用其他代理。SDK 的 Runner 循环会处理这些转移：调用 LLM → 执行工具或手递 → 循环直到输出最终结果。证据显示，这种机制支持开放式任务，如市场分析，其中初始代理分解任务为子模块（如数据收集、分析、总结），每个子模块由专精代理处理，从而提升整体准确率。

共享工具访问进一步增强了图的连通性。代理可以共享相同的工具集，例如函数工具用于数据库查询或外部 API 调用。在实现中，通过 @function_tool 装饰器定义工具，并将其附加到多个代理上。状态传播则依赖 Sessions 机制：SQLiteSession 或 RedisSession 自动维护对话历史，确保手递时上下文不丢失。例如，在一个多代理链中，第一个代理的工具输出会作为消息追加到会话中，传递给下游代理。这避免了手动状态管理，类似于图中节点间的边携带数据包。实际案例中，这种设计在客服系统中表现突出：查询代理共享搜索工具，响应代理继承状态生成个性化回复。

为了落地实施，需要关注参数调优和监控。设置 max_turns=10 以防无限循环，结合 output_type（如 Pydantic 模型）确保结构化输出。Guardrails 可添加输入/输出验证，例如长度检查或内容过滤，防止图执行偏离轨道。Tracing 功能提供可视化：每个手递生成 span，展示执行路径，便于调试。风险包括 LLM 决策不一致导致的路径爆炸，可通过提示工程缓解，如明确定义手递条件：“仅当任务涉及 X 时手递给 Y 代理”。

可落地参数与清单：

代理配置：
- instructions: 清晰描述角色和手递触发器，例如 “如果你需要专业翻译，手递给翻译代理”。
- tools: 共享列表，如 [search_tool, calc_tool]，确保所有代理访问统一工具库。
- handoffs: 指定下游代理列表，支持动态选择。
执行参数：
- max_turns: 5-15，根据任务复杂度调整；超时阈值 30s/转。
- session: 使用 RedisSession 对于分布式部署，支持并发会话 ID 如 user_id。
- model: 选择 gpt-4o-mini 以平衡成本和性能。
监控与回滚：
- 启用 Tracing，集成 Logfire 或 Braintrust 导出 spans。
- 阈值警报：如果手递深度 >3，触发回滚到单一代理模式。
- 评估：使用 SDK 的 evals 模块测试图执行成功率，目标 >90%。
扩展清单：
- 并行执行：使用 asyncio.gather 运行独立子图，提高吞吐。
- 人类介入：集成 human-in-the-loop，在关键节点暂停等待反馈。
- 规模化：限制活跃代理数 <10，避免资源耗尽；使用 LiteLLM 支持多模型路由。

通过这些实践，图执行不仅提升了系统的可扩展性，还降低了开发复杂度。在一个模拟的供应链优化场景中，这种 orchestration 将规划代理、执行代理和验证代理连接成图，动态调整路径以响应实时数据变化，最终实现 20% 的效率提升。开发者应从小规模原型开始迭代，逐步引入复杂手递，确保图的鲁棒性。

（字数：1025）