首页 › 2025年 › 11月 › LLM指导的迭代CUDA内核精炼:通过自动融合与平铺实现GEMM操作17倍加速
2025年11月21日 ai-systems

LLM指导的迭代CUDA内核精炼:通过自动融合与平铺实现GEMM操作17倍加速

面向GEMM操作的CUDA内核优化,给出LLM引导的迭代精炼流程、融合平铺参数与验证要点,实现17x加速。

内容加载中...