首页 › 2025年 › 09月 › 通过 nvmath-python 的 cuBLASLt 绑定,在 PyTorch 中实现偏差融合以提升推理性能
2025年09月22日 mlops

通过 nvmath-python 的 cuBLASLt 绑定,在 PyTorch 中实现偏差融合以提升推理性能

利用 nvmath-python 的高级 Matmul API,将偏差加法融合进 cuBLASLt 矩阵乘法内核,减少内存往返与内核启动开销,实测推理性能提升显著。

内容加载中...