首页 › 2025年 › 09月 › 在4x树莓派5集群上实现Qwen3 30B A3B 13 token/s推理速度的工程优化清单
2025年09月07日 ai-systems

在4x树莓派5集群上实现Qwen3 30B A3B 13 token/s推理速度的工程优化清单

面向低成本ARM集群,给出量化、并行调度与内存优化的可落地参数清单,实测推理速度达13 token/s。

内容加载中...