首页 › 2025年 › 09月 › 工程化 FlashAttention-4 内核移植到 ROCm:HIP 迁移与多查询推理优化
2025年09月28日 ai-systems

工程化 FlashAttention-4 内核移植到 ROCm:HIP 迁移与多查询推理优化

面向 AMD GPU 的 FlashAttention-4 移植,给出 HIP 迁移步骤、内存优化要点与多查询推理工程参数。

内容加载中...