首页 › 2025年 › 10月 › 在 AMD CDNA4 上利用 MFMA 指令和波前调度优化 GEMM 内核:针对 MI300X 的 AI 推理吞吐量
2025年10月06日 ai-systems

在 AMD CDNA4 上利用 MFMA 指令和波前调度优化 GEMM 内核:针对 MI300X 的 AI 推理吞吐量

针对 AMD CDNA4 架构的 MI300X 加速器,利用 MFMA 指令和波前调度优化 GEMM 内核,提升 AI 推理吞吐量的工程实践与参数配置。

内容加载中...