首页 › 2025年 › 11月 › 火山引擎 verl:支持 PPO Actor-Critic 和 KL 正则化的离线 RLHF 工具包
2025年11月26日 ai-systems

火山引擎 verl:支持 PPO Actor-Critic 和 KL 正则化的离线 RLHF 工具包

火山引擎 verl 开源 RLHF 工具包,提供 PPO actor-critic 架构、KL 正则化、梯度裁剪及多 GPU 分布式训练的关键参数与工程实践。

内容加载中...