首页 › 2025年 › 11月 › 利用 AWS EFA 的 RDMA 实现万亿参数 LLM 的高效张量分片与低延迟推理
2025年11月13日 ai-systems

利用 AWS EFA 的 RDMA 实现万亿参数 LLM 的高效张量分片与低延迟推理

基于 AWS EFA 的 RDMA 技术,优化万亿参数大模型的张量分片与并行推理,提供查询服务可扩展性参数与监控要点。

内容加载中...