首页 › 2025年 › 09月 › 使用 Triton 融合线性注意力内核实现亚二次复杂度:长序列 Transformer 的高效 O(n) 缩放
2025年09月14日 ai-systems

使用 Triton 融合线性注意力内核实现亚二次复杂度:长序列 Transformer 的高效 O(n) 缩放

基于 Flash Linear Attention 项目,探讨 Triton 融合内核如何实现线性注意力的 sub-quadratic 复杂度,支持长序列 Transformer 的 O(n) 高效缩放,提供工程化配置与优化参数。

内容加载中...