首页 › 2025年 › 10月 › MiniMind 中梯度累积与动态批处理优化:有限硬件下高效训练 26M GPT
2025年10月19日 mlops

MiniMind 中梯度累积与动态批处理优化:有限硬件下高效训练 26M GPT

在 PyTorch 中实现梯度累积和动态批处理,用于有限硬件上训练 26M 参数 GPT 模型,降低内存开销并保持收敛速度,提供工程参数和监控要点。

内容加载中...