首页 › 2025年 › 10月 › Coral NPU 上并发多模型推理的运行时调度器设计:低延迟切换与内存分区优化
2025年10月19日 ai-systems

Coral NPU 上并发多模型推理的运行时调度器设计:低延迟切换与内存分区优化

针对电池受限 IoT 设备,探讨 Coral NPU 多模型并发推理的调度策略,包括上下文切换机制、共享内存分配参数,以及功耗优化要点,确保低延迟和高效率。

内容加载中...