首页 › 2025年 › 10月 › 轻量级 LLM 部署的可插拔推理加速模块设计
2025年10月24日 ai-systems

轻量级 LLM 部署的可插拔推理加速模块设计

通过模块化设计实现推理加速技术的灵活组合,在边缘设备上达成 2-3 倍吞吐量提升的同时保持模型精度。

内容加载中...