随着 AI 训练集群规模从万卡向十万卡演进,铜缆互连的功耗与带宽密度瓶颈日益凸显,Co-Packaged Optics(CPO,共封装光学)正从实验室概念加速走向 2025-2026 年的商业化落地。然而,这一技术跃迁背后隐藏着复杂的供应链分层与潜在的单点故障风险。本文基于当前 CPO / 光子学产业生态的供应链图谱,拆解六大层级结构,识别关键风险节点,并探讨国产替代的可行路径。
供应链分层:六大层级的权力结构
CPO 供应链并非线性链条,而是以平台厂商和制造赋能者为核心的辐射型结构。按照功能可划分为六个关键层级:
系统 / AI 基础设施层:以 NVIDIA 为代表,定义带宽与功耗需求,驱动技术路线选择。这一层掌握最终采购决策权,对下层供应商形成强力牵引。
Switch ASIC/CPO 平台层:Broadcom、NVIDIA、Marvell 等芯片厂商主导,负责将光学引擎与交换芯片近距离集成。这一层是技术方案的总集成点,决定了光学引擎的接口规格与封装形式。
晶圆厂 / 先进封装层:TSMC 处于绝对核心地位,其 COUPE(Compact Universal Photonic Engine)平台是 CPO 量产的关键使能者。3D 封装、混合键合、晶圆级光学对准等工艺能力构成竞争壁垒。
硅光 / PICs 层:包括 TSMC COUPE、STMicroelectronics、Ayar Labs、Lightmatter、Celestial AI 等,提供集成光子电路(PIC)和光学引擎。这一层技术路线分化明显,硅光、薄膜铌酸锂、聚合物等方案并存。
激光器 / 光器件层:Coherent、Innolight(中际旭创)等提供光源和收发组件。激光器的可靠性、波长稳定性直接决定 CPO 模块的寿命与性能。
OSAT / 封装测试层:传统封装测试厂商及 TSMC 关联生态负责最终的光学 attach、热管理设计与光学验证。这一层在 CPO 时代的重要性被显著放大,因为光学对准精度要求从微米级提升到亚微米级。
单点故障风险识别
基于上述分层结构,可识别出三个关键的单点故障风险节点:
风险一:先进封装产能集中。TSMC 在晶圆级光学封装领域的技术积累和产能布局具有显著领先优势。若地缘政治或自然灾害导致其 CPO 相关产能受限,整个供应链将面临断供风险。据行业分析,CPO 封装环节的产能瓶颈可能比传统芯片封装更为严峻,因为光学对准设备的专业性和稀缺性更高。
风险二:跨厂商互操作性缺失。与可插拔光模块时代不同,CPO 方案高度依赖 Switch ASIC 与光学引擎的紧耦合设计,缺乏统一的互操作性标准。这意味着一旦选定某家 Switch ASIC 供应商,光学引擎的选择空间将被大幅压缩,形成事实上的供应商锁定。这种碎片化状态延缓了多厂商规模化部署的进程。
风险三:热管理与光学验证。CPO 将高功耗的光学引擎与交换芯片封装在一起,热设计复杂度指数级上升。同时,光学 attach 的精度要求、光纤耦合的可靠性、以及在线光学监测能力,都是尚未完全解决的工程难题。任何一环的失效都可能导致整机的性能劣化或宕机。
国产替代路径:三个可切入环节
面对上述风险,国产供应链可在以下三个环节寻找替代机会:
环节一:硅光芯片设计与制造。国内已有企业布局硅光 PIC 设计,但在工艺平台层面仍依赖境外晶圆厂。短期可关注与 TSMC COUPE 兼容的设计服务机会;中长期需推动本土硅光工艺平台的成熟,特别是在薄膜铌酸锂等差异化路线上建立优势。
环节二:激光器与光器件。Coherent 和 Innolight 在高端激光器市场占据主导地位,但国产厂商在 25G/50G 速率段已具备量产能力。CPO 对激光器的需求将从可插拔模块的外置方案转向共封装的内置方案,这对国产厂商是技术升级窗口。建议关注具备 VCSEL 和 EML 技术储备的本土企业。
环节三:OSAT 与光学封装。这是国产替代潜力最大的环节。CPO 封装对光学对准、光纤耦合、热管理的特殊要求,使得传统 OSAT 需要升级能力,也创造了差异化竞争空间。国内封装大厂可优先投入晶圆级光学测试、自动化光学对准设备等能力建设,切入 CPO 后端供应链。
可落地的风险缓解策略
对于 AI 基础设施采购方和供应链管理者,建议采取以下可落地的风险缓解措施:
供应商多元化清单:建立 Switch ASIC(Broadcom/NVIDIA/Marvell)、硅光引擎(TSMC COUPE/Ayar Labs/Lightmatter)、激光器(Coherent/Innolight/ 国产候选)的三维供应商矩阵,避免单一来源依赖。
互操作性跟踪机制:密切关注 OIF(Optical Internetworking Forum)和 IEEE 的 CPO 标准进展,要求供应商提供标准符合性路线图。在合同层面预留标准升级的技术变更条款。
热设计与验证能力内化:鉴于热管理和光学验证是 CPO 可靠性的关键,建议在系统层面建立自主的测试验证能力,而非完全依赖供应商的规格书。
地缘政治风险预案:针对 TSMC 产能集中度风险,评估 Intel Foundry、Samsung 等替代方案的技术成熟度时间线,制定分阶段的供应商切换预案。
CPO 技术的商业化进程正在重塑 AI 集群互连的供应链格局。识别关键风险节点、建立多元化的供应商体系、并在标准制定中争取话语权,将是未来两年 AI 基础设施供应链管理的重中之重。
参考来源
- Siemens Semiconductor Packaging: Five Key Trends of Co-Packaged Optics (CPO) in 2026
- Tom's Hardware: Photonics and high-speed data movement is the next big AI bottleneck
- Mitsui Research: Co-Packaged Optics Gain Traction in Data Centers (2026 年 4 月报告)
内容声明:本文无广告投放、无付费植入。
如有事实性问题,欢迎发送勘误至 i@hotdrydog.com。