首页 › 2025年 › 09月 › 详解 nvmath-python 中 epilog 机制如何配置参数,将偏置加法融合进 cuBLASLt 矩阵乘内核
2025年09月22日 ai-systems

详解 nvmath-python 中 epilog 机制如何配置参数,将偏置加法融合进 cuBLASLt 矩阵乘内核

通过 Matmul.plan 的 epilog 与 epilog_inputs 参数,配置 BIAS/RELU_BIAS 等枚举值与张量输入,实现偏置加法与矩阵乘的内核级融合,减少内存往返。

内容加载中...