首页 › 2025年 › 10月 › 使用 MiniMind 快速原型化 GPT 模型:单 GPU 2 小时训练 26M 参数
2025年10月18日 ai-systems

使用 MiniMind 快速原型化 GPT 模型:单 GPU 2 小时训练 26M 参数

面向单 GPU 环境,给出 MiniMind 框架下自定义 tokenizer、梯度累积与动态批处理的 PyTorch 训练管道参数与优化要点。

内容加载中...