首页 › 2025年 › 09月 › 使用Dynamo协调异构GPU上的数据中心规模LLM推理:Rust分片与动态路由
2025年09月28日 ai-systems

使用Dynamo协调异构GPU上的数据中心规模LLM推理:Rust分片与动态路由

Dynamo框架通过Rust-based sharding、动态路由和零拷贝张量共享,实现异构GPU环境下的低延迟LLM服务。探讨核心架构与工程参数配置。

内容加载中...