首页 › 2025年 › 10月 › 从零构建 26M GPT 训练管道:自定义分词器、高效数据加载与单 GPU 评估循环
2025年10月19日 ai-systems

从零构建 26M GPT 训练管道:自定义分词器、高效数据加载与单 GPU 评估循环

基于 MiniMind,介绍单 GPU 从零训练小型 GPT 的核心实现,包括 tokenizer 训练、数据管道和评估机制。

内容加载中...