线性驱动光模块技术专家会议纪要

会议纪要 2023-03-21 12:02

LPO是一种新技术,剑桥、海信等厂商刚发布产品,预计今年年底或明年才能实现量产。LPO是基于Linear Driver芯片技术实现的可插拔光模块。目前主流的200G/400G/800G的产品都是基于PAM4的技术加上DSP芯片来实现高速、高调制的信号恢复和传输。为了降低系统功耗,LPO光模块使用的TIA、Driver芯片性能提升,实现更好的线性度,从而并去掉DSP。

目前主流高速光模块通过DSP实现性号恢复,从而达到低误码率。DSP就是高速数字处理芯片,除了提供CDR能提供的数字时钟恢复功能之外,还可以进行色散补偿操作,去除噪声、非线性干扰等因素。DSP优势是具有很强的信号恢复能力,劣势是成本高(800G光模块中DSP要几十美金)、延迟大、功耗高、发热明显。

现在通过LPO线性直驱的技术把DSP替换,系统成本功耗、延迟提升,但是系统误码率和传输距离有所牺牲。所以LPO只适用于特定领域(短距离,比如服务器到架顶交换机之间的连接)。此外,LPO技术也需要依赖交换机芯片性能的提升,如T51.2T的Tomahawk 5在信号恢复方面的功能提升。我们判断,未来LPO技术将逐步应用于最高不超过500m的短距离传输场景中。

Q:LPO相比传统方案成本降幅如何?

A:以800G光模块为例,BOM成本为600-700美金,DSP芯片价值约50-70美金。LPO技术虽然去掉了DSP,但TIA&DRIVER需要高线性度芯片,成本较之前可能增长3-5美金,系统总体成本预计下降在8%-9%。此外,成本并不是LPO最大的优势,最大的优势在于降功耗和降延迟。

Q:高线性度TIA&Driver的主要供应商有哪些?

A:代表性厂商有Macom、Semtech、美信,这三家是原来比较强的电芯片厂商,但在DSP上不如博通和Inphi,希望弯道超车。所以它们大力推LPO线性直驱的驱动和TIA芯片,不过博通也有跟进。

Q:剑桥可借助Macom的能力,所以在LPO光模块方面有一定优势吗?

A:封装和设计不是LPO技术的绝对门槛,区别主要在电芯片。根据公开资料,剑桥科技Macom在芯片供应上有战略合作关系,我们推测Macom的高线性度的TIA DRIVER技术会第一时间给到剑桥去开发LPO的线性直驱光模块。

Q:谷歌上量的800G是使用传统的DSP,大概多久LPO能真正上量?

A:目前只是技术发布,对应芯片还未规模化量产,Macom和Semtech还在送样,今年年底芯片量产,今年年底到明年年初模块量产。

至于上量到多大规模,多少客户会采购,取决于客户倾向。光模块领域规格非常多,包括SR100米、低压500米、FR两公里、LR10公里,2公里的需求量超50%,但LPO牺牲了DSP的很高信号恢复能力,主要还是用在低规格、短距离的连接场景,如海信发布的LPO技术需要用OM4光纤传输50m的连接,LPO技术很大程度上只能替换DAC/AOC短距离&几十米内的连接需求。

下游客户的倾向也有区别。谷歌一贯以来对新技术相对保守,硅光、线性直驱光模块都是以牺牲性能为代价换取成本优势,谷歌不太愿意尝试。微软和meta可能会愿意接受LPO这种方案,但他们的800G还没上量。今年800G的需求大概是50-70万只,但主要被谷歌采购,所以不确定明年LPO方案能否放很大量,估计从2024-2025年逐步上量。

比如Ⅱ-Ⅵ在400G时代就搞过LPO技术,但当时性能不太好。在800G时代一是整个芯片技术提升,高线性度的TIA/DRIVER、交换机以及DSP的数据恢复性能都提升,二是DSP成本和功耗更显著,所以LPO的性能和成本优势更明显体现了,大家接受度更高。

Q:目前各家公司的进度哪家更快更好?

A:目前头部公司都不错。剑桥和Macom有良好的合作,其他头部光模块大厂也都是从Macom、Semtech拿到Tia Driver,大家拿芯片的时间差异不大,目前处于同一起跑线。Meta和微软在对LPO产品做测试验证,谷歌目前还未接受该新产品,亚马逊还没启动测试,预计今年下半年会送样&测试。另外,设备商Arista非常推崇LPO技术,但海外设备商800G上量时间会比云厂商更晚。

Q:距离适用范围就只是服务器接到架顶交换机吗?

A:是的,目前只能实现50米之内的连接。比如,海信发布的LPO光模块命名为ODAC,对标不是2公里的光模块,而是和DAC去竞争,因为随着速率越来越高,铜缆可实现的连接距离会大大缩水,LPO技术相对于DAC铜缆技术可以进一步拓宽连接场景,调整系统功耗,有一定优势。但随着交换机的信号恢复能力提升,有希望拓展到架顶交换机和叶交换机的互连,这种互连基本需要百米级,如果LPO由50米以内拓展到百米级,会增加一些市场应用。

Q:占比最大的交换机之间互连的场景,还是以传统光模块为主?

A:对,100G时代的主流规格是PSM4和CWDM4,2公里的规格占40%左右的量。200G的主要采购规格是 FR4,400G由前期短距离DR4后转到2公里FR4,所以CWDM4、FR4是大型IDC的主要规格。2公里对应的实际连接距离是500米-2公里范围,即500米以上都用2公里规格。

Q:CPO主要替代DR4距离,LPO主要替代服务器到架顶交换机的距离,都是降低功耗和成本,未来哪个技术发展趋势会更快。

A:LPO是光模块的封装形式,是可插拔模块向下演进的技术路线,主要用来实现降功耗;CPO也是演进的路线,但不是在可插拔光模块架构下,而是将光模块移到靠近交换机芯片,做到交换机设备里面。LPO更容易实现、确定性更强,最早今年下半年,最晚明年就会在市场上有真正的需求。CPO是一项全新的技术,速率越高,它能实现的降功耗水平越高。当前光模块引入LPO技术可以降35%-50%的功耗,速率更高后,由于LPO离不开光模块的形式,在整个系统上降功耗水平有限,因为将来大量的功耗是在光模块到核心交换机芯片的连接距离上。CPO解决的就是这个链动距离上的功耗问题,跟LPO降光模块本身的功耗是两件事,CPO由于涉及大量全新技术,第一代产品至少也会在两年后出来,真正上量可能要到2026-2027年。

Q:头部几家光模块企业在LPO技术方面进展?

A:差不多,因为这项技术的核心不是光模块本身,而是芯片。有了芯片之后都能做,只是看愿不愿意做。

Q:Meta从测试验证到上量差不多要大半年?

A:是的。客户做可靠性测试至少要5000小时,80-90天,大概要3个月。大规模采购前还有小批量采购做系统兼容性测试,需要1.5-3个月。总的来说,规模化量产前需要大半年时间验证。

Q:Meta和微软没有采购指引只是在做测试?

A:今年对800G需求较强的是谷歌和英伟达,明年meta和亚马逊大概率会上量,但不确定量是多少,今年年底招投标时会更确定一些。