首页 › 2025年 › 10月 › Transformer 中蝴蝶因子分解用于低秩注意力近似
2025年10月23日 ai-systems

Transformer 中蝴蝶因子分解用于低秩注意力近似

探讨在Transformer中使用蝴蝶结构矩阵近似低秩注意力,实现大模型在消费级GPU上的内存优化训练,提供工程参数与实现要点。

内容加载中...