首页 › 2025年 › 09月 › 利用 Gluon 的 Triton 编译栈编写高性能 GPU 内核:跨硬件可移植加速
2025年09月18日 compilers

利用 Gluon 的 Triton 编译栈编写高性能 GPU 内核:跨硬件可移植加速

基于 Gluon 的 Triton 编译栈,用 Python 编写高效 GPU 内核,实现张量操作的跨 NVIDIA 和 AMD 硬件加速,包括内核示例、优化参数和可移植性指南。

内容加载中...