首页 › 2025年 › 11月 › 使用 VERL 的 HybridFlow 构建混合 RL 工作流:LLM 微调的模块化策略优化
2025年11月21日 ai-systems

使用 VERL 的 HybridFlow 构建混合 RL 工作流:LLM 微调的模块化策略优化

VERL 的 HybridFlow 框架通过混合控制器模型,支持 RL 阶段的灵活组合,从离线数据生成到在线更新,实现 LLM 高效对齐。提供模块化 API 和设备映射参数,提升生产级 RLHF 吞吐量达 20 倍以上。

内容加载中...