Page 656

最新见解 · 第 656 页

共 16860 篇文章,分类 267 个。

最新见解

近期的思考与工程笔记。

查看归档
2025-10-18 ai-engineering

分布式凸松弛技术优化SGD:多GPU LLM微调加速30%

将单纯形优化的凸松弛技术适应到分布式SGD变体中,通过优化all-reduce模式和分片策略,实现多GPU LLM微调中30%更快的收敛。聚焦工程化实现,避免通信瓶颈,提供可落地参数和监控要点。

阅读全文 →