首页 › 2025年 › 10月 › BitNet 的 TVM 优化移动部署:位串行操作与低延迟内核融合
2025年10月06日 ai-systems

BitNet 的 TVM 优化移动部署:位串行操作与低延迟内核融合

整合 TVM 编译器传递以支持 BitNet 中的位串行操作,实现移动端低延迟的 1 位 LLM 推理,包括内核融合和运行时调度。

内容加载中...