首页 › 2025年 › 10月 › 在 Triton 内核中使用 Cutlass 命名实现自定义 FP8 操作的加速
2025年10月03日 ai-systems

在 Triton 内核中使用 Cutlass 命名实现自定义 FP8 操作的加速

利用 Cutlass 命名在 Triton 内核中解锁自定义 FP8 操作的 100 TFLOPS 加速,聚焦融合注意力等超出 GEMM 的应用。

内容加载中...