首页 › 2025年 › 12月 › Verl中FSDP通信重叠与阈值调优:KL正则化PPO的多GPU分片策略
2025年12月01日 ai-systems

Verl中FSDP通信重叠与阈值调优:KL正则化PPO的多GPU分片策略

针对KL正则化PPO的多GPU FSDP分片,详解通信重叠策略如forward prefetch,以及动态阈值调优参数,实现高效LLM RL流水线。

内容加载中...