首页 › 2025年 › 11月 › VERL中多代理RL工作流的编排:基于LLM的任务分解、奖励共享与复杂环境中的 emergent 协作
2025年11月18日 ai-systems

VERL中多代理RL工作流的编排:基于LLM的任务分解、奖励共享与复杂环境中的 emergent 协作

利用VERL框架编排多代理强化学习工作流,支持LLM驱动的任务分解、奖励共享机制,实现复杂环境下的 emergent 协作行为,提供工程参数与监控要点。

内容加载中...