首页 › 2025年 › 10月 › Implementing Custom JAX Transformations in Tunix for Low-Latency LLM Inference
2025年10月04日 ai-systems

Implementing Custom JAX Transformations in Tunix for Low-Latency LLM Inference

探讨在 Tunix 框架中使用自定义 JAX 变换实现动态图剪枝和算子融合,以实现边缘设备上 LLM 推理的低延迟优化,提供工程参数和监控要点。

内容加载中...