首页 › 2025年 › 09月 › 利用 MLX 统一内存、量化和 KV 缓存优化 Apple Silicon 上的 LLM 推理
2025年09月15日 ai-systems

利用 MLX 统一内存、量化和 KV 缓存优化 Apple Silicon 上的 LLM 推理

面向 Apple Silicon 的 LLM 推理优化,给出 MLX-LM 中统一内存、量化与 KV 缓存的工程参数与多模型切换策略。

内容加载中...