首页 › 2025年 › 09月 › 通过三值权重量化在 CPU 上部署 1-bit LLM:实现笔记本低延迟推理
2025年09月07日 ai-systems

通过三值权重量化在 CPU 上部署 1-bit LLM:实现笔记本低延迟推理

面向资源受限硬件如笔记本,利用 BitNet 的三值权重量化部署 1-bit LLM,给出 CPU 优化参数与低延迟推理的工程化实践。

内容加载中...