分类:gpu-programming

1 篇文章

CUDA PTX 入门内核编写

面向 CUDA GPU 的基本 PTX 汇编内核实现,强调线程索引、共享内存分配与同步,以及避免分支发散和银行冲突的实用技巧。