首页 › 2025年 › 09月 › nvmath-python 封装 cuBLASLt:为 PyTorch 提供低开销矩阵乘法与偏置融合原语
2025年09月22日 ai-systems

nvmath-python 封装 cuBLASLt:为 PyTorch 提供低开销矩阵乘法与偏置融合原语

剖析 nvmath-python 如何通过 cuBLASLt 绑定实现矩阵乘、偏置、激活函数的单内核融合,给出 compute_type、epilog_inputs、plan/execute 分离等可落地参数配置。

内容加载中...