首页 › 2025年 › 09月 › Cactus框架下INT8量化与NPU加速的低功耗AI推理管道
2025年09月19日 ai-systems

Cactus框架下INT8量化与NPU加速的低功耗AI推理管道

基于Cactus框架,结合INT8量化与NPU硬件加速,实现智能手机低功耗多模态AI模型部署,支持实时语音与视觉任务的工程参数与优化策略。

内容加载中...