首页 › 2025年 › 10月 › MiniMind 中集成旋转位置嵌入:优化因果注意力长序列处理与外推
2025年10月20日 ai-systems

MiniMind 中集成旋转位置嵌入:优化因果注意力长序列处理与外推

在 MiniMind 框架中集成 RoPE 以提升小规模 GPT 训练的长序列处理能力,提供外推参数调优和工程实践要点。

内容加载中...