首页 › 2025年 › 09月 › 使用 Triton 融合线性注意力内核:长序列 Transformer 的亚二次复杂度优化
2025年09月14日 ai-systems

使用 Triton 融合线性注意力内核:长序列 Transformer 的亚二次复杂度优化

针对长序列 Transformer,利用 Triton 融合内核实现亚二次复杂度,通过重计算和分块策略最小化内存带宽。

内容加载中...