首页 › 2025年 › 11月 › 用 Ironwood TPU 部署低延迟 AI 推理:3nm 工艺、192GB HBM3E 与优化软件栈的高吞吐实践
2025年11月26日 ai-systems

用 Ironwood TPU 部署低延迟 AI 推理:3nm 工艺、192GB HBM3E 与优化软件栈的高吞吐实践

Ironwood TPU 凭借 3nm 工艺、192GB HBM3E 内存与 vLLM/GKE 软件栈,实现低延迟高吞吐 AI 推理服务,提供部署参数、阈值与监控清单。

内容加载中...