Page 149

最新见解 · 第 149 页

共 16860 篇文章,分类 267 个。

最新见解

近期的思考与工程笔记。

查看归档
2026-02-11 ai-systems

动态内存预算模拟器:预防模型训练OOM的工程化设计

针对大模型训练中的内存溢出问题,本文设计了一个动态内存预算分配与OOM预防策略的模拟器,用于预计算训练过程中的内存峰值与梯度累积开销,并提供可落地的参数配置与监控清单。

阅读全文 →