剖析 DeepResearch 多跳架构:IterResearch 如何实现动态规划与认知聚焦
深入解析 Tongyi DeepResearch 的多跳推理架构,详解 IterResearch 范式如何通过任务解构与工作区重建,解决长程任务中的信息过载问题。
在人工智能从“对话助手”迈向“自主研究者”的关键跃迁中,多跳推理能力是衡量一个智能体是否具备深度信息处理与复杂问题解决能力的核心标尺。阿里巴巴通义实验室开源的 Tongyi DeepResearch,不仅在多个权威基准测试中性能比肩甚至超越行业标杆,其背后所采用的创新架构——特别是名为 IterResearch 的推理范式——为解决多跳推理中的“认知窒息”与“噪声污染”难题提供了极具工程价值的方案。本文将深入剖析这一架构,揭示其如何通过动态规划与认知聚焦,实现复杂问题的分步拆解与高效求解。
DeepResearch 的核心创新在于其双模推理架构。它并非依赖单一的推理路径,而是提供了两种互补的模式:原生的 ReAct 模式和进阶的 Heavy 模式(基于 IterResearch 范式)。ReAct 模式,遵循经典的“思考-行动-观察”循环,是评估模型内在基础能力的黄金标准。它简洁、通用,能充分利用模型 128K 的超长上下文进行多轮交互,验证模型在结构化推理和工具调用上的基本功。然而,对于真正的“深度研究”任务——那些需要跨越数十个信息源、进行多轮归纳与演绎的复杂问题——ReAct 模式会遭遇瓶颈。随着交互轮次的增加,所有历史信息被线性堆叠在一个不断膨胀的上下文窗口中,导致关键信号被海量噪声淹没,模型的“认知焦点”逐渐模糊,最终陷入“认知窒息”,推理质量急剧下降。
这正是 IterResearch 范式被设计出来的原因。它从根本上重构了智能体与环境的交互方式,其核心思想是“解构”与“重建”。面对一个复杂问题,IterResearch 不会试图在单一、庞大的上下文中解决它,而是将其动态拆解为一系列结构清晰的“研究回合”(Research Rounds)。在每一个研究回合的开始,智能体并非继承全部历史记录,而是仅携带上一回合输出的、经过提炼的“核心结论”或“关键发现”。基于这些精华信息,智能体在当前回合内重建一个高度精简、目标明确的“工作空间”。在这个聚焦的工作空间里,智能体重新分析问题,规划下一步行动——是发起新的网络搜索、调用计算工具,还是整合现有信息形成阶段性报告。完成本轮行动并获得观察结果后,智能体再次进行提炼,将本轮的核心产出作为“遗产”传递给下一轮。这种“综合-重建”的迭代循环,确保了智能体在漫长的任务链条中,始终能保持清晰的思维主线和高质量的推理状态,有效避免了信息过载导致的性能衰减。
为了将这一架构落地,开发者需要关注几个关键的工程参数与实现要点。首先是上下文管理策略。虽然模型支持 128K 的上下文,但在 Heavy 模式下,应主动限制每个研究回合内处理的 token 数量,强制进行信息提炼。官方建议在实现时,为每个回合设定一个明确的“报告摘要”环节,这不仅是输出,更是为下一轮重建工作空间提供输入。其次,是工具调用的封装。IterResearch 依赖于稳定、高效的工具沙盒。在开源代码的 inference/react_agent.py
中,开发者需要配置好搜索、计算、文件解析等工具的 API 密钥,并确保沙盒具备缓存、重试和故障转移机制,以保证在多轮交互中工具调用的可靠性,避免因外部服务不稳定而打断推理链条。最后,是“研究-合成”(Research-Synthesis)框架的运用。对于极端复杂的开放性问题,可以启动多个并行的 IterResearch 代理,各自从不同角度或路径探索问题,最后由一个专门的“合成代理”汇总各代理的精简报告,生成最终的综合性答案。这种并行结构极大地扩展了模型在有限上下文窗口内探索问题空间的能力。
这一架构已在实际场景中得到验证。例如,在与高德地图合作的“小高”出行智能体中,面对“规划一条包含特定景点和宠物友好酒店的多日自驾游路线”这类复杂查询,IterResearch 范式能够分步解决:第一轮聚焦景点筛选与路线初排,第二轮专攻酒店搜索与匹配,第三轮则进行时间与交通状况的优化整合。同样,在“通义法睿”法律研究智能体中,它能系统性地执行“检索相关法条 -> 交叉引用相似案例 -> 归纳裁判要旨 -> 生成带精确引用的法律意见书”这一多跳流程,每一步都在一个认知聚焦的工作空间内完成,确保了专业级的准确性和可追溯性。
当然,这一先进架构也非完美无缺。其首要限制在于,128K 的上下文长度对于某些超长周期、信息极度密集的研究任务而言,仍然是一个瓶颈。未来的方向可能是探索更高效的上下文压缩与分块管理技术,或者直接扩展模型的上下文窗口。其次,Heavy 模式的实现复杂度远高于标准的 ReAct,它要求开发者对任务进行精细的结构化设计,并实现稳健的信息提炼与传递机制,这对工程能力提出了更高要求。尽管如此,Tongyi DeepResearch 通过 IterResearch 范式所展现的动态规划与认知聚焦能力,无疑为构建下一代能够真正“做研究”的 AI 代理,树立了一个清晰且可复用的技术标杆。