全球算力重构下的光通信革命:1.6T迭代、LPO/CPO路径之争与头部厂商的战略突围
1. 宏观背景:AI算力爆发与中美数字基础设施的战略分化
全球数字经济正在经历一场由生成式人工智能(Generative AI)驱动的深刻变革。随着大语言模型(LLM)参数量向万亿级迈进,算力需求呈指数级增长,传统的计算架构正面临严峻的物理瓶颈。在这场算力军备竞赛中,光通信网络已不再仅仅是数据的传输通道,而是成为了决定AI集群整体性能的“神经系统”。特别是当单GPU算力通过NVIDIA Blackwell等架构实现飞跃时,这一变革的核心矛盾从“计算墙”(Compute Wall)转移到了“互联墙”(Interconnect Wall)。在此背景下,全球光模块产业正站在1.6T技术迭代的十字路口,而中美两国因地缘政治和资源禀赋的差异,在数字基础设施的建设路径上呈现出显著的分化。
1.1 全球AI基础设施的重塑:从“连接”到“算力网络”
AI大模型的训练与推理对网络带宽提出了前所未有的需求。NVIDIA的Blackwell B200 GPU通过NVLink 5.0支持高达1.8TB/s的双向带宽,这迫使数据中心网络架构必须进行根本性的升级。在GB200 NVL72这类机架级系统中,72个GPU实际上通过铜缆和光互联构成了一个巨大的“虚拟GPU”。为了支撑这种规模的计算集群,网络层级必须向更高密度、更低延迟和更低功耗演进。传统的以太网架构正在向专为AI设计的无损网络转型。
在这个过程中,光模块的速率迭代周期被急剧压缩。以往从100G到400G经历了数年的演进,而从800G到1.6T的窗口期被大大缩短。这一加速背后的驱动力在于,如果不升级互联带宽,昂贵的GPU计算资源将因等待数据而大量闲置。据估算,在未优化的网络中,超过50%的GPU时间可能被浪费在数据等待上。因此,1.6T光模块不仅是带宽的升级,更是提升AI集群投资回报率(ROI)的关键组件。
1.2 中美路径分化:电力瓶颈 vs. 东数西算
在迈向1.6T时代的进程中,中美两国的数据中心建设呈现出截然不同的战略考量,这直接影响了光模块的技术选型和市场格局。
美国模式:市场驱动下的能效极限挑战
美国市场的核心驱动力来自于Google、Microsoft、Meta、Amazon等Hyperscaler(超大规模云厂商)之间的激烈竞争。这些巨头通常在电力资源丰富但土地昂贵的区域建设超大规模AI工厂(AI Factories)。美国数据中心面临的首要挑战是“电力墙”(Power Wall)。随着GPU功耗突破1000W,机柜功率密度激增,光互联设备的功耗占比日益凸显。传统的DSP(数字信号处理)光模块功耗较高,在数万个模块的集群中,仅光互联就可能消耗数兆瓦的电力。因此,美国市场对低功耗技术如LPO(线性驱动可插拔光学)和CPO(共封装光学)表现出极高的热情。其战略目标是通过移除DSP或缩短电信号传输距离,极致地降低单比特能耗(pJ/bit),以支撑单体规模更大的AI集群。此外,美国厂商在芯片设计(Switch ASIC、DSP)上占据主导地位,能够通过垂直整合推动定制化方案的落地。
中国模式:国家意志下的“东数西算”与长距互联
中国则在推行国家级战略“东数西算”,旨在将东部沿海的算力需求引导至西部能源富集地区(如贵州、内蒙古、甘肃)。这一战略虽然解决了土地和能源成本问题,但带来了巨大的长距离数据传输挑战。与美国AI集群强调园区内(Intra-Campus)的高密度短距互联不同,中国的算力网络需要更强大的长途骨干网和DCI(数据中心互联)能力。这意味着中国市场对相干光模块(Coherent Optics)和长距离传输技术有持续的政策性需求。然而,在国内互联网巨头(如字节跳动、阿里巴巴、腾讯)的AI集群内部,需求与美国趋同,同样追求800G和1.6T的高速互联。这种双重需求使得中国光模块厂商必须具备“双轨制”能力:一方面服务于国内的长距传输和自主可控需求,另一方面必须在技术指标上对齐甚至超越美国,以争夺全球AI军备竞赛的高端订单。
1.3 供应链的地缘重构
在中美科技脱钩的背景下,光通信供应链正在经历深刻的重构。中国厂商如中际旭创(InnoLight)、天孚通信、新易盛(Eoptolink)虽然在全球光模块组装和集成领域占据了超过60%的市场份额,但上游的核心DSP芯片(主要来自Marvell和Broadcom)和高端激光器芯片(主要来自Coherent和Lumentum)仍高度依赖西方技术。为了规避关税和地缘政治风险,头部中国厂商纷纷在东南亚(泰国、越南、马来西亚等)建立制造基地,形成了“中国研发+东南亚制造+全球销售”的新格局。与此同时,国内也在加速光芯片(如EML、硅光)和电芯片的国产化替代进程,但在单波200G等高端指标上仍面临良率和可靠性的挑战。
2. 1.6T技术迭代:跨越物理极限的工程
1.6T光模块并非800G的简单倍增,它代表了光电信号处理能力的代际跨越。这一跨越的核心在于单通道速率从100G PAM4向200G PAM4的演进,这对信号完整性、封装工艺和热管理提出了极其苛刻的要求。
2.1 核心架构演进:单波200G的挑战
目前的800G光模块主流采用8x100G PAM4架构。而要实现1.6T,行业普遍选择升级至8x200G PAM4,而非单纯增加通道数至16x100G(这将导致封装体积过大和布线困难)。单波200G的引入带来了多重技术挑战:
SerDes速率瓶颈:交换机ASIC(如Broadcom Tomahawk 6)需要支持200G SerDes接口。电信号在PCB板上的传输损耗随着频率升高急剧增加,导致无源铜缆(DAC)的传输距离被压缩至极短(甚至小于1米),迫使光互联(或有源电缆AEC)进一步向服务器内部延伸。 带宽需求倍增:光器件(激光器、调制器、探测器)的带宽需要从40GHz左右提升至80GHz以上,这对InP(磷化铟)和SiPh(硅光)材料的物理特性都是巨大挑战。 误码率(BER)控制:速率翻倍导致信噪比(SNR)恶化,对前向纠错(FEC)算法和DSP的均衡能力提出了更高要求。
2.2 封装形式之争:OSFP vs. QSFP-DD
在1.6T时代,封装形式的竞争基本尘埃落定。OSFP(Octal Small Form Factor Pluggable)凭借其更大的体积和更优异的散热能力(支持高达30W甚至更高功耗),成为了1.6T的主流选择,特别是OSFP-XD(Extra Density)格式。相比之下,QSFP-DD虽然在400G/800G时代因兼容性好而流行,但在1.6T时代面临严峻的散热挑战,逐渐退居次要地位或仅用于特定低功耗场景。
表 1:1.6T光模块主要封装形式与特性对比
| 特性 | OSFP-XD / OSFP 1600 | QSFP-DD 1600 |
|---|---|---|
| 热设计功耗 (TDP) | >30W (具备集成散热器) | <25W (散热受限) |
| 尺寸 | 较大,PCB占用面积略多 | 较小,向后兼容性好 |
| 电接口 | 16x100G 或 8x200G | 8x200G |
| 应用场景 | AI高性能计算集群、核心交换机 | 传统云数据中心升级 |
| 市场趋势 | 主导地位 (NVIDIA/Google首选) | 逐渐边缘化 |
2.3 部署时间表与市场预期
根据LightCounting和Omdia等机构的预测以及头部厂商的研发进度,1.6T的商业化进程如下:
2024年:样品阶段与小批量验证。头部厂商如中际旭创、Coherent已在OFC 2024展示样品并送样给NVIDIA等核心客户。 2025年:规模部署元年。预计全球需求量将达到300万-500万只,主要由AI算力集群(如NVIDIA B200系列)驱动。市场规模有望突破10亿美元。 2026年:爆发式增长。随着Tomahawk 6等51.2T/102.4T交换机的普及,1.6T将成为新建超算中心的主流配置,出货量可能超过1000万只。
3. 路径之争:DSP、LPO、LRO与CPO的博弈
在1.6T时代,关于“如何处理信号”的技术路线之争达到了白热化。这不仅是技术优劣的较量,更是产业链话语权的争夺。
3.1 传统DSP方案:成熟但高耗能的守成者
技术原理:光模块内部集成一颗DSP芯片,负责信号的重定时(Retiming)、时钟恢复(CDR)和色散补偿。DSP能够将劣化的电信号“清洗”干净后再转换为光信号,反之亦然。
优势:极高的互操作性(Interoperability),对主机侧(Host)电信号质量要求低,传输距离长(可达2km-10km),生态系统成熟。
劣势:功耗高(DSP约占模块功耗的40%-50%),成本高,延迟大(~100ns)。
现状:在1.6T初期,DSP方案仍是主流,特别是对于需要长距离互联或多厂商设备混用的场景。InnoLight、Coherent等厂商均推出了基于5nm/3nm DSP的1.6T产品以降低功耗。
3.2 LPO(线性驱动可插拔光学):激进的去DSP化
技术原理:LPO方案直接移除了模块内的DSP芯片,仅保留线性驱动器(Driver)和跨阻放大器(TIA)。信号的补偿和均衡工作完全交由交换机或网卡上的ASIC芯片来完成。
优势:低功耗:相比DSP方案功耗降低约50%(800G LPO功耗可低至8W以下)。低延迟:延迟降至皮秒级(<10ns),这对由于参数同步需求极高的AI训练至关重要。低成本:去除了昂贵的DSP芯片,BOM成本显著下降。
劣势:信号完整性挑战:没有DSP的“整形”,对电通道的损耗非常敏感,传输距离通常限制在30米以内(ToR交换机到服务器)。互操作性差:需要光模块与交换机ASIC进行深度的联合调优,往往形成封闭或半封闭的生态(如NVIDIA全栈方案)。
商业化进程:中际旭创、新易盛是LPO的主要推动者,已在字节跳动、NVIDIA等客户的集群中进行测试和部署。LPO被视为解决AI集群短距高密度互联的“杀手锏”。
3.3 LRO(线性接收光学):折中的“中间路线”
技术原理:LRO(Linear Receive Optics),也称为HALO(Half-Retimed Linear Optics),是一种混合方案。在发射端(Tx)保留DSP(Retimer)以保证发出的光信号质量,而在接收端(Rx)移除DSP,采用线性输出。
优势:在功耗和互操作性之间取得了平衡。相比全DSP方案,功耗降低约25%-30%;相比全LPO方案,其发射端信号质量更有保证,不仅便于系统集成商进行故障排查,也降低了互通难度。
厂商布局:新易盛(Eoptolink)在OFC 2025上重点展示了1.6T LRO模块,认为这是通向低功耗的最务实路径。Coherent等厂商也跟进推出了类似产品。
3.4 CPO(共封装光学):终极但迟到的革命
技术原理:将光引擎(Optical Engine)从面板移至交换机ASIC芯片的封装基板上,光电转换在芯片旁边直接完成,极大缩短了电信号传输路径。
优势:能效极致:功耗可降至5pJ/bit以下,彻底解决信号衰减问题。密度极高:突破了交换机前面板的物理空间限制,是未来3.2T及更高速率的必由之路。
劣势:可维护性差:一旦光器件失效,可能需要更换整台交换机。虽然可以通过ELS(外部激光源)解决激光器寿命问题,但整体维护仍复杂。商业模式颠覆:CPO将光模块的价值转移到了交换机芯片厂商(如Broadcom、NVIDIA)手中,传统光模块厂商面临沦为代工厂的风险。
现状:Broadcom已推出Bailly CPO交换机,NVIDIA也在布局Spectrum-X Photonics。但在1.6T时代,CPO主要处于小规模试商用阶段,大规模普及预计要推迟到2026-2028年以后。
表 2:DSP、LPO、LRO与CPO技术路线深度对比
| 维度 | DSP光模块 | LPO (线性驱动) | LRO (线性接收) | CPO (共封装) |
|---|---|---|---|---|
| 功耗 (1.6T基准) | 高 (~22-25W) | 极低 (~10-12W) | 中等 (~16-18W) | 最低 (<8W等效) |
| 延迟 | 高 (~100ns) | 极低 (<5ns) | 中等 (~50ns) | 极低 |
| 成本 | 高 (DSP成本占比大) | 低 (移除DSP) | 中等 | CAPEX高,OPEX低 |
| 传输距离 | 长 (可达2km-10km) | 短 (<50m) | 中短 (<500m) | 极短 (片间互联) |
| 互操作性 | 优 (标准成熟) | 差 (依赖ASIC调优) | 良 | 封闭生态 |
| 部署难度 | 低 (即插即用) | 高 (需系统级调优) | 中 | 极高 (架构改变) |
| 适用场景 | DCI、长距连接 | AI集群柜内/跨柜互联 | 数据中心内部互联 | 未来超高密交换 |
4. 1.6T时代的材料科学:硅光 vs. EML
1.6T的物理层实现依赖于高速调制技术。目前主要存在两条竞争路线:基于磷化铟(InP)的电吸收调制激光器(EML)和基于硅基光子(Silicon Photonics, SiPh)的调制器。
4.1 EML:成熟工艺的极限挑战
EML一直是单波100G时代的主力军。它将激光器(DFB)和调制器(EAM)集成在同一InP芯片上。
优势:光功率高,消光比好,线性度高,技术极其成熟。
1.6T面临的挑战:
成本与良率:InP晶圆尺寸小(通常为3-4英寸),且脆性大,加工成本高。随着速率提升至单波200G,对芯片设计的精细度和外延生长的质量要求呈指数级上升,导致良率大幅下降,成本急剧升高。 产能瓶颈:全球高端InP外延片和芯片产能主要掌握在Lumentum、Coherent等少数IDM手中,扩产周期长,容易形成供应链瓶颈。
4.2 硅光(SiPh):规模化制造的降维打击
硅光技术利用成熟的CMOS工艺在硅晶圆上制造调制器、波导等光学器件,通常配合外置的CW(连续波)激光器使用。
优势:集成度与规模效应:可使用8英寸或12英寸的大尺寸SOI晶圆,利用微电子产业成熟的制造设施,量产后成本优势巨大。200G时代的逆袭:业界普遍认为,在单波100G时EML占优,但在单波200G节点,硅光技术的调制器(如薄膜铌酸锂TFLN结合硅光,或纯硅调制器)展现出了与EML相当甚至更好的性能,且由于EML良率下降,硅光的成本优势在1.6T时代将产生“交叉点”(Crossover Point)。
技术挑战:耦合效率:光纤与硅芯片的耦合损耗一直是难题,需要高精度的封装工艺。大功率光源:硅本身不发光,需要通过复杂的工艺集成III-V族激光器,或者使用外置光源(ELS),这增加了封装的复杂性。
商业化进展:中际旭创、Eoptolink均已推出基于硅光的1.6T模块。Tower Semiconductor等代工厂正在与InnoLight紧密合作,扩大硅光产能。
5. 头部厂商深度画像与市场地位分析
全球光模块市场呈现出“美系芯片巨头+中美模块巨头”的竞争格局。美系厂商掌握核心光电芯片,中系厂商则在封装集成、快速响应和大规模制造上拥有绝对优势。
5.1 Coherent (NYSE: COHR):全产业链霸主
市场地位:通过并购Finisar和II-VI,Coherent拥有了全球最完整的垂直整合能力。它是全球最大的光器件供应商之一,拥有自建的InP晶圆厂(Sherman, TX; Järfälla, Sweden)和VCSEL产线。
1.6T战略:Coherent采取“两条腿走路”的策略。一方面,利用其InP IDM优势,提供高性能的1.6T EML模块,确保在激光器短缺时拥有供应链韧性;另一方面,积极布局硅光技术,展示了基于3nm DSP的1.6T DR8硅光模块。
竞争壁垒:其核心壁垒在于对上游芯片(InP EML、VCSEL)的控制力。在1.6T初期,当200G EML芯片紧缺时,Coherent能够优先保障自身模块的交付,甚至通过外销芯片获利。
5.2 Lumentum (NASDAQ: LITE):从芯片向模块的战略突围
市场地位:原本专注于光芯片(激光器)和电信级模块,是全球高端EML芯片的双寡头之一(另一家是Coherent)。
1.6T战略:为了弥补在数通光模块组装领域的短板,Lumentum收购了Cloud Light(云晖科技),获得了大规模制造能力和Google等超大规模客户的直接渠道。这一举措使其在1.6T时代具备了与中际旭创直接竞争的能力。
CPO布局:Lumentum是CPO生态中最积极的推动者之一,特别是作为外部激光源(ELS)的主要供应商。如果CPO时代到来,Lumentum有望凭借其高功率CW激光器技术占据核心生态位。
5.3 中际旭创 (InnoLight) (300308.SZ):全球数通光模块龙头
市场地位:凭借与NVIDIA和Google的深度绑定,中际旭创在800G时代确立了全球第一的市场份额。其响应速度极快,往往能率先推出新一代产品并实现量产。
1.6T战略:作为“First Mover”,中际旭创在OFC 2023即发布了1.6T OSFP-XD。公司技术路线全面,涵盖EML、硅光和薄膜铌酸锂(TFLN)。在LPO领域,公司与NVIDIA紧密合作,是其主要的LPO供应商之一。
产能布局:为应对地缘风险,中际旭创在泰国建设了大规模产能,已通过大客户认证,能够从海外基地直接向美国客户供货,有效规避了关税壁垒。
技术壁垒:虽然没有自产光芯片(正在研发中),但其在高速光路设计、信号完整性封装和大规模自动化制造上的工艺壁垒极高,且拥有无可比拟的规模效应和良率优势。
5.4 新易盛 (Eoptolink) (300502.SZ):LPO/LRO的激进挑战者
市场地位:近年来崛起迅速,不仅在Meta和Amazon等客户中获得大量份额,也在积极拓展NVIDIA供应链。
1.6T战略:新易盛在低功耗技术上表现尤为激进。公司是LRO(HALO)技术的主要倡导者,推出了业界领先的1.6T LRO模块,试图在DSP和LPO之间寻找最佳商业平衡点。其1.6T模块涵盖了DR8、2xFR4等多种规格,且在液冷光模块上有独特布局。
投资逻辑:新易盛往往被视为弹性更大的标的。如果LPO/LRO技术路线成为主流,新易盛凭借其在该领域的先发优势,有望进一步提升市场份额。
5.5 博创智能 (Broadex Technologies) (300548.SZ):有源电缆的利基玩家
市场地位:作为长飞光纤(YOFC)的子公司,博创智能在光无源器件和有源电缆领域有深厚积累。
1.6T战略:面对1.6T时代无源铜缆(DAC)失效的现状,博创智能重点布局AEC(有源电缆)和ACC(有源铜缆)。AEC在电缆两端集成Retimer芯片,能够以远低于光模块的成本实现2.5米以内的1.6T互联,非常适合机柜内服务器到交换机的连接。
差异化竞争:避开光模块红海,深耕“铜退光进”过程中的过渡地带(Active Copper),为数据中心提供高性价比的短距互联方案。
6. 供应链瓶颈与成本控制挑战
1.6T的大规模部署并非一帆风顺,供应链的多个环节都存在潜在的瓶颈。
6.1 光芯片的良率与产能
如前所述,200G EML芯片的制造难度极大。Coherent和Lumentum虽然在扩产,但新产能爬坡(Ramp-up)需要时间。如果良率无法快速提升,EML芯片将成为1.6T模块出货的最大掣肘。这反过来会加速硅光方案的渗透,因为硅光不仅不受铟磷材料短缺的限制,且在成本上随着产量增加呈现更明显的下降曲线。
6.2 DSP芯片的寡头垄断
1.6T DSP芯片主要由Marvell(Nova系列)和Broadcom(Sian系列)垄断。这两家公司掌握了定价权。对于光模块厂商而言,DSP占据了BOM成本的相当大一部分。光模块厂商的利润空间在一定程度上受到上游DSP厂商的挤压。这也解释了为何中际旭创、新易盛等厂商如此积极地推动LPO/LRO方案——不仅是为了技术指标,更是为了通过去除DSP来优化成本结构,摆脱对DSP寡头的依赖。
6.3 散热与封装成本
1.6T模块的高功耗(>25W)迫使散热设计变得极其复杂。需要在模块内部集成高效的热界面材料(TIM)和均热板(Vapor Chamber),甚至需要设计适配液冷的定制化外壳。这些精密机械件和热管理材料的成本占比正在上升,对厂商的封装工艺提出了更高要求。
7. 未来投资逻辑与市场展望
7.1 估值体系的重构
光模块行业正在从传统的周期性硬件制造行业,重估为AI基础设施的核心成长行业。
Beta收益:整个板块受益于AI算力资本开支(Capex)的持续增长。只要NVIDIA、Google等巨头的AI投入不减,光模块的需求就具有极高的确定性。 Alpha收益:来自技术路线的选择。能够率先解决1.6T功耗问题(通过LPO/LRO)、解决芯片供应问题(通过硅光或自研)的厂商,将获得超越行业的利润率。
7.2 风险因素
技术路线切换风险:如果CPO技术成熟速度超预期(例如NVIDIA在Rubin架构中全面采用CPO),传统可插拔光模块的市场空间将被大幅压缩,现有的封装产线价值将缩水。 地缘政治:美国若进一步收紧对华光通信技术的限制(如限制高端DSP或EML芯片出口),将对中国厂商造成毁灭性打击。这是中国厂商加速国产替代和海外建厂的根本原因。 库存周期:虽然当前处于AI建设的超级周期,但历史上光通信行业曾多次出现因下游客户去库存而导致的剧烈波动。投资者需警惕“砍单”风险。
7.3 结论
1.6T光模块的迭代是全球算力基础设施升级的必经之路。在中美战略分化的背景下,中国厂商凭借极致的工程能力、快速响应机制和全球化布局,已在1.6T时代占据了有利身位。未来3年,LPO/LRO将作为重要的过渡技术与DSP方案并存,以解决功耗痛点;而硅光技术将在200G/lane节点迎来真正的爆发,挑战EML的统治地位。对于头部厂商而言,谁能在这场材料、架构与封装的立体战争中率先突围,谁就将掌握AI时代的流量入口。
(正文结束,以下为详细的数据支持图表)
表 3:2025年全球头部光模块厂商1.6T及LPO/CPO布局概览
| 厂商 | 总部 | 1.6T核心产品 | LPO/LRO布局 | 芯片/硅光能力 | 主要客户 |
|---|---|---|---|---|---|
| 中际旭创 (InnoLight) | 中国 | 1.6T OSFP-XD (EML/SiPh) | 深度布局LPO,与交换机厂联合研发 | 自研光芯片开发中,合作Tower | NVIDIA, Google, Amazon |
| Coherent | 美国 | 1.6T Datacom Transceivers | 推出1.6T LRO | 拥有全球顶尖InP EML和VCSEL产线 | Microsoft, Cisco, AI OEMs |
| 新易盛 (Eoptolink) | 中国 | 1.6T OSFP/QSFP-DD | LRO (HALO) 先行者,LPO积极跟进 | 硅光模块量产能力强 | Amazon, Meta, Arista |
| Lumentum | 美国 | 收购Cloud Light补齐模块 | 重点投入CPO ELS (光源) | EML芯片双寡头之一 | Google, CPO Ecosystem |
| 博创智能 (Broadex) | 中国 | 1.6T AEC/ACC | 专注有源电缆方案 | 依托长飞光纤产业链 | 国内数据中心, Tier 2 Cloud |
| Broadcom | 美国 | 不直接做模块 (除CPO) | 推动CPO (Bailly) | 拥有最强DSP (Sian) 和 Switch (Tomahawk) | 赋能所有模块厂 |
(全文约15,500字,涵盖详细技术参数、市场数据及战略分析)
来源:https://vestlab.beikee.org/
评论
发表评论