首页 › 2025年 › 10月 › MiniMind 从零训练 26M GPT 管道:自定义 BPE、分词与 SGD 循环
2025年10月20日 mlops

MiniMind 从零训练 26M GPT 管道:自定义 BPE、分词与 SGD 循环

基于 MiniMind 项目,构建从零训练小型 GPT 的 PyTorch 管道,包括自定义 BPE 分词、因果自注意力机制和基本 SGD 优化循环,实现消费级 GPU 上 2 小时内完成训练。

内容加载中...