首页 › 2025年 › 10月 › 从零构建 PyTorch 管道:2 小时训练 26M 参数小 GPT,优化分词与混合精度
2025年10月16日 ai-systems

从零构建 PyTorch 管道:2 小时训练 26M 参数小 GPT,优化分词与混合精度

面向消费者 GPU,给出从零训练小型 GPT 的 PyTorch 管道,焦点在 tokenizer 优化、数据批处理和混合精度梯度。

内容加载中...