首页 › 2025年 › 11月 › VERL中多GPU FSDP下KL正则化PPO的通信重叠与分片阈值调优
2025年11月30日 mlops

VERL中多GPU FSDP下KL正则化PPO的通信重叠与分片阈值调优

VERL框架中FSDP分片PPO训练,优化KL正则化通信overlap策略、分片阈值参数,实现高效RLHF pipeline。

内容加载中...