首页 › 2025年 › 11月 › Engineering Emergent Collaboration in VERL via Reward Sharing
2025年11月19日 ai-systems

Engineering Emergent Collaboration in VERL via Reward Sharing

VERL的多代理RL框架通过奖励共享策略实现LLM任务分解中的涌现协作,提升离线对齐效果,提供工程化参数与监控要点。

内容加载中...