首页 › 2025年 › 09月 › Flash 线性注意力实现 Transformer 的 O(n) 缩放
2025年09月14日 ai-systems

Flash 线性注意力实现 Transformer 的 O(n) 缩放

通过高效 Triton 内核实现线性注意力,支持长序列 Transformer 的 O(n) 复杂度和子二次方计算,无需注意力掩码,提供工程化集成参数。

内容加载中...