首页 › 2025年 › 09月 › Gemini 2.5 Flash-Lite 变体的知识蒸馏与量化优化:实现超低延迟推理
2025年09月26日 ai-systems

Gemini 2.5 Flash-Lite 变体的知识蒸馏与量化优化:实现超低延迟推理

通过知识蒸馏和量化技术精简 Gemini 2.5 模型,提供低延迟推理的工程参数与落地清单。

内容加载中...