Hotdry.

Latest Essays

最新见解 · 第 897 页

继续沿着时间线阅读近期的工程实践与技术观察。

已收录 21665 篇文章主题 316 个

最新见解

近期的思考与工程笔记。

分布式凸松弛技术优化SGD:多GPU LLM微调加速30%

将单纯形优化的凸松弛技术适应到分布式SGD变体中,通过优化all-reduce模式和分片策略,实现多GPU LLM微调中30%更快的收敛。聚焦工程化实现,避免通信瓶颈,提供可落地参数和监控要点。

2025-10-18ai-engineering2025-10

PyTorch 中基于凸松弛的最优优化器实现

基于最近数学突破,利用凸松弛优化 simplex 方法思想,设计 PyTorch 优化器,加速非凸神经网络训练,在 CIFAR-10 上实现 20-50% 收敛加速。

2025-10-18ai-engineering2025-10
上一页第 897 / 1084 页下一页