首页 › 2025年 › 09月 › 利用 nvmath-python 的 cublasLt 接口融合偏置加法与矩阵乘法
2025年09月22日 systems

利用 nvmath-python 的 cublasLt 接口融合偏置加法与矩阵乘法

详解如何通过 nvmath-python 的 epilog 机制,在单个 GPU 内核中融合矩阵乘与偏置加法,消除 PyTorch 中的中间内存分配,提升计算效率。

内容加载中...