铜缆更新:AEC市场规模,主要厂商,未来预测,价格及成本构成
要点要点:
1.AEC市场规模及应用场景
2.未来增长趋势情况
3.价格及成本构成
4.市场份额情况
Q&A
请简要介绍一下AEC市场的规模及其应用场景,并预测未来的增长趋势。
AEC在铜缆传输领域中曾是一个较小的细分市场,主要通过两端增加Retimer芯片来扩展现有无源铜缆(DAC)的传输距离。例如,在AI网络中,使用DAC进行400G或800G速率传输时,距离通常在1至1.5米,而一个机柜的高度通常为2至3米,因此即使在机柜范围内,DAC也无法满足互联需求。但在通过信号恢复、整形后,AEC可以将距离扩展到5至7米。目前如Credo给微软、XAI等厂商大量出货的AEC产品,其规格为5米左右,通过线材优化可达到7米。这使得从GPU网卡到机柜顶部交换机的互联成为可能。
目前整个AEC市场规模不到200万条,例如AWS每季度采购约2,600万美元的AEC,大约16-17万条,全年的采购量约70多万条。预计2024年AWS对AEC的需求将达到180-200万条。此外,包括微软、Oracle、Meta和谷歌等客户也有望导入这一技术。过去AI网络主要使用光方案(AOC),虽说AOC能连几十米,但是几十米在机柜内是冗余的。原来主要是英伟达通过打包将成套方案出给客户,但随着博通以太网交换机等替代方案出现,更多厂商选择自己搭建AI网络,以及成本方面的考虑,越来越多客户选择了性价比更高的AEC产品。
AEC是否能够完全替代AOC?未来的发展趋势如何?
AEC无法完全替代AOC,因为两者各有优劣。虽然在短距离内(如机柜内部)采用性价比更高的AEC是合理选择,但对于需要更长传输距离、更低误码率及更强抗干扰能力的场景,仍需依赖于AOC。虽然AEC不是近期才出现的,但近期AEC是AI网络中首次导入了从0到1的新应用,使得未来几年内这一市场将迎来显著增长。目前已有1.6T速率的AEC正在送样测试,如果算力芯片跟得上,这一解决方案依然有效。
目前主要哪些企业在使用或计划使用AEC?
目前AWS、微软以及Meta等企业已经开始大量采购并使用AEC。这些企业已经与Credo展开合作。
50515148
AWS等大客户为何选择大量采购400G而非800G AEC?
GPU的算力和配套的网卡的速率决定了AEC的速率。AWS目前大量采购400G AEC是为了配套其自研ASIC芯片 Trainium 2,该芯片算力较英伟达B系列低,因此不需要用到800G连接速率即可满足数据传输出口要求。尽管如此,从明年起,包括微软和其他公司将在20%左右比例上逐步升级至800G,总体规模约100万条左右,余下的300-400万条还是400G。而随着算力芯片性能提升,如英伟达B系列及自研算力芯片推出后,将进一步推动1.6T甚至更高速率AEC解决方案的发展。
XAI的800G产品预计市场占比如何?
目前,XAI和Credo正在联合定制800G的零抖动AEC产品。其交换机采用英伟达的Spectrum以太网交换机开CR得则采购H100、B200系列。预计明年下半年,B200系列会率先配备800G产品。根据推测,XAI上半年仍以400G为
AEC与AOC相比有哪些优势和劣势?
AEC相较于AOC具有显著成本优势,同样速率的一根800G光缆成本约为800美元,而同样速率的一根800G电缆成本仅为250-300美元。因此,大客户考虑到性价比,更倾向于采用非英伟达方案,如博通以太网交换机和AEC,以大幅度降低成本。然而,AOC在传输距离、稳定性、误码率以及抗干扰能力上仍具有优势。因此,不同客户根据其网络架构和成本目标会选择不同方案,两种方案将并行存在。
目前,XAI和Credo正在联合定制800G的零抖动AEC产品。其交换机采用英伟达的Spectrum以太网交换机,GPU则采购H100、B200系列。预计明年下半年,B200系列会率先配备800G产品。根据推测,XAI上半年仍以400G为主,预计四到五十万条。到二季度末,将逐步向800G切换,预计800G产品出货量超过30万条。
B200系列中铜缆的类型是AEC还是DAC?
在英伟达推行的NVL72机柜方案中,机柜内GPU互联均采用无源铜缆。但每个GPU通常配备网卡连接至顶层交换机,构成Scale-out网络。这种网络适合构建大规模集群(如5万至10万卡),但跨机柜距离较长时DAC无法满足要求。因此,在跨机柜互联时,会采用AEC方案来支持约5米的连接距离。
机柜内GPU之间的数据传输是如何实现的?
机柜内每个GPU通常会标配一个网卡,通过家庭交换机进行横向扩展网络(scale-out network)的连接。该网络使用以太网协议,可以实现跨节点扩展和互联。例如,英伟达的Hope芯片配备400G网卡(如X7),通过多模光模块与其他交换机进行远距离互联。此外,每个GPU还通过NV Switch芯片实现内存语义协议的数据共享,从而在大模型推理时快速高带宽地搬运数据。但这种方式的区域有限,早期是8张卡互联,现在Blackwell对其进行了扩展,扩展到72张卡,将来可能扩展到288卡甚至1,024卡,但需要等待更大模型参数的发展及技术进步。
如果使用自研ASIC芯片,是否可以将交换机放置在中间,从而减少传输距离?
如果是它自己的ASIC芯片的话,它是可以把交换机放到中间来减少它的传输距离的、然而问题有于染研心得芯片的算力和资源不足,无法达到像英伟达那样集中算力的水平。因此,他们需要通过多个机柜组合形成类似
如果是它自己的ASIC芯片的话,它是可以把交换机放到中间来减少它的传输距离的。然而问题在于这些自研ASIC芯片的算力和资源不足,无法达到像英伟达那样集中算力的水平。因此,他们需要通过多个机柜组合形成类似
于“超节点”的域,通常需要64个甚至更多的ASIC芯片进行全互联。这种情况下,即便交换机放在中间,互联距离仍可能超过1.1米至1.5米,最终还是需要依赖AEC来实现跨机柜的长距离互联。
机柜间的传输是否可以用AEC来实现?
机柜间的传输可以使用AEC,但一般用于相邻机柜之间的连接。如果机柜之间的距离过远,超出AEC的连接能力,就无法实现良好的互联。
机柜间交换机的放置是否可以灵活调整,比如放在中间还是顶上?
机柜间交换机的位置可以灵活调整,取决于机柜的设计。对于一些客户自研芯片和机柜设计的情况,他们通常会将交换机放置在中间,以平衡各GPU节点之间的互联距离,尽量缩短平均互联距离。这种设计能够优化传输性能并降低部分互联成本。
目前AEC的增量空间主要来源于哪里?
目前AEC的增量空间主要来源于机柜间的传输。未来,随着机柜规模扩大、速率提高(例如从单线112G提升到224G甚至448G),无源铜缆的适用距离会进一步缩短。到那时,即便在机柜内部,也可能需要使用AEC来实现高
带宽的互联。
目前机柜间和机柜内传输配比情况如何?
目前,AWS等公司在GPU与800G和400GAEC之间的配比为1:1。例如,AWS拥有150多万张卡,如果都配备 AEC,则需要150万条AEC,因为每个芯片都会独立连接一条线缆以避免数据冲突。而在机柜内部,由于带宽需求更大,通常配比会达到1:3甚至更高。例如,Blackwell芯片对外跨机柜连接时使用800G(CX8)网卡,但其内部72张卡之间互联时,每个GPU带宽为双向1.8TB每秒,从单向看即7,200Gbite每秒,内部带宽是外部带宽的9倍。因此,内部需要更多数量和更高速率的AEC。
明年各大客户对AEC需求量预计如何?
明年,各大客户将大规模扩建AI数据中心,并使用自有方案替代英伟达方案,因此预计会有显著增量。目前AWS采购了约180万条AEC。AWS今年有70万条左右的量,微软和其他公司今年采购量较小,大概都是20万条左右,总计约140-150万条,但明年需求量预计会显著增加。
东南业组装是否具有成本优势?国内生产效率和成本情况如何?
虽然东南亚人力成本较低,但综合考虑生产效率、良率以及原材料物流成本后,在东南亚组装并不具备明显成本优势。目前短期内大部分企业仍以国内生产为主,因为国内生产效率更高且总体成本更具竞争力。
各家厂商的良率水平如何?不同速率和距离对良率有什么影响?
良率水平受多种因素影响,包括客户固定需求、传输距离及速率等。例如5米与7米长线缆良率不同,线缆越长信号干扰越强,误码率可能越差,良率就会越低一点。另一个因素是速率,400G产品已相对成熟,可达到90%以上良率,而800G产品目前良率仅85%左右。因此,高速传输距离越远规格越高的产品,其良率相对较低。但总体来看,各家统揽线材的良率水平还是比较不错,大多数情况下可以达到百分之八九十左右。
目前在Retimer芯片领域,国内外厂商的市场份额如何?
在Retimer芯片领域,海外厂商如Credo、Marvell等已经占据了较大的市场份额。博通与新易盛合作,博通在这一块的市场份额将提升。Marvell则与瑞可达、博创科技合作,其市场份额可能接近20%。AsteraLabs主要为英伟达定制产品,将来如果英伟达有AEC需求,Astera Labs的产品也会增加出货量。他们原来主要做服务器内的互联,但到了AEC方面,需要纳米级的,且要支持以太网协议,二者技术原理相似,只是需要一定程度上的改进。国内厂商在这方面进度稍微落后,但已有立项进行研发。
更多厂商进入Retimer芯片市场是否会降低价格?
是的,随着规模优势逐渐显现,研发成本摊薄,会导致价格下降。目前Retimer芯片主要分为三种:短距离板卡上的Retimer,支持PCle协议;用于铜缆传输支持以太网协议的Retimer;以及兼容光信号的odsp Retimer。这些产品虽然门槛不高,但仍需具备高速SerDes和信号恢复方面的积累。因此,无论是从PCle Retimer向上做更高规格 AEC Retimer,还是从odsp向下打入AEC市场,都需要一定技术积累。国产厂家若能实现40%的毛利,也可以通过性价比优势占据市场。
您对国内AEC厂商的发展前景怎么看?
个人比较看好兆龙,因为其技术布局较早,在国内首先与字节跳动、阿里巴巴、快手和腾讯等公司定制AEC,并且在供应链上拥有自己的线材供应和较大产能。此外,虽然兆龙的技术实力也许不是最好的,但是其配合度良好,因此被字节跳动选中作为供应商。海外市场上,兆龙还为Credo代工,这使得其在技术和市场布局上都具有前瞻性,有望最早受益于AEC市场爆发。他的Retimer,如果是给Credo代工的部分是Credo直接指定的,给字节等厂商的部分目前是Marvell的,之后可能是博通的。
其他值得关注的国内AEC厂商有哪些?
瑞可达也是值得关注的一家企业,其与旭创合作,通过旭创渠道进入海外市场,将来价格和毛利都不会差。在合资公司中,瑞可达占60%股份,负责AEC的生产、交付,而旭创负责大客户需求对接、销售渠道及规格把关。因此,在利润分配上瑞可达将占优。此外,现在了解到越来越多客户将推自研ASIC芯片,自研ASIC芯片通常会优先选择
性价比更高的互联方案,这对瑞可达等企业来说是一个机会。
AEC价格及成本构成如何?
目前400G AEC价格在150-200美元之间,根据采购量不同有所浮动,大批量采购最低可达150美元。800G AEC尚未大规模出货,目前价格约300美元,占总出货量20%。其中核心成本来自两个Retimer芯片,每颗24美元,总计48美元,占总成本40%左右。线材成本按长度计算,8美元/米,一般标准长度为5米,总计40美元。此外,还有端头连接器、屏蔽材料、加工组装测试等费用,共计30-40美元。因此,总成本约120美元另而Credo售价300美元左导右,使得毛利率超过60%
AEC产品未来的发展趋势如何?国内企业将如何应对这些变化?
随着越来越多AI大客户对网络建设需求增加,以及全球范围内更多企业加入竞争,预计未来几年内会有更多国内企业进入并扩大其在AEC领域中的份额。例如,新易盛计划通过提高毛利率来参与价格竞争,而兆龙互联则凭借其物理发泡设备优势提升线材生产能力。总体来看,随着技术成熟度提高和产能扩展,这些企业将逐步替代现有主导供应方,实现更大的市场占有率。
物理发泡设备的采购情况如何?目前市场上有哪些主要供应商?
目前全球范围内,物理发泡设备主要依赖于奥地利的罗森泰设备厂商。尽管国内也有一些厂商能够生产类似设备,但在均匀性、一致性和稳定性方面仍不及海外产品。因此,在高速线缆应用中,仍需依赖海外设备以确保较高的良率和性能。
明年三季度是否所有厂商都能出货AEC线缆?
最快明年三季度,AEC线缆的供应可能会跟上市场需求。兆龙主要通过两条渠道进行生产:海外市场采取代工模式,国内则与自身供应链和阿里合作。同时,字节预计在春节后启动对AEC的招标,兆龙在配合度和技术能力上表现突出。
AEC市场在未来一年的发展预期如何?
AEC市场需求在明年将继续旺盛,预计整体市场需求量为400至500万条。其中,Credo一家占比60%以上,今年占比70%以上,后续国产厂商将逐步进入,预计市场份额有所降低,但由于市场规模急剧增长,供不应求局面仍将持续。
国内AEC线缆价格与海外相比如何?国内需求情况如何?
国内AEC线缆价格相对海外低15%左右,大约几十美金。然而,目前国内对400G产品需求较大,对800G产品需求有限。总体来看,由于芯片要求较低,因此价格也相对较低。
国内外主要客户及合作渠道有哪些?
AWS导入新易盛铜缆非常简单,无需认证供应商,只需在系统里面增加一个料号即可采购。同样道理,瑞可达通过旭创渠道推给终端客户,如谷歌、Meta甚至英伟达。而长芯盛则配合寒武纪开发卡间互联,并有机会进入字节产业链。此外,兆龙等公司也在积极布局国内外市场,通过东南亚组装进一步拓展出口业务。
国内厂商是否需要海外工厂才能出口?
海外客户倾向于从东南亚采购产品,以降低中美贸易摩擦和芯片供应链风险。但目前还未成为强制要求,国内企业依然可以出口。拥有海外和国内产能的企业在投标和份额分配时具有优势,未来灵活的产能调配能力至关重要。
东南亚组装是否具有成本优势?国内生产效率和成本情况如何?
虽然东南亚人力成本较低,但综合考虑生产效率、良率以及原材料物流成本后,往东南亚组装并不具备明显成本优势。目前短期内大部分企业仍以国内生产为主,因为国内生产效率更高且总体成本更具竞争力。
400G与800G AEC在成本上的主要区别是什么?
400G与800G AEC主要区别在于通道数量及相应芯片和线材成本。每个通道的一发一收都是用两根线,所以一个通道是4根线。400G采用4通道设计,每通道100G速率,共16根导体线;而800G采用8通道设计,共32根导体线,因此线材成本较高。此外,400G Retimer芯片面积较小且制程要求低,大约在14美元一颗,而800G Retimer芯片需7纳米或更高制程工艺,因此制造成本更高。
当前市场上AEC产品的主要供应商有哪些?
Credo是最早做AEC产品的公司之一,可以说是AEC产品的创始者。2018年,Credo开始开发这种用于跨机柜连接、速率较低(如100G、200G)的铜缆解决方案,并在2019年发起成立了AEC产业联盟。从2019年至2023年, Credo几乎是市场上唯一的AEC供应商,一直为微软供货。其他厂商,如国内一些做铜缆的厂商,由于上游 Retimer芯片难以获取,因此在AEC领域涉足较少。
为什么过去市场上很少有厂商开发AEC相关芯片?
AEC市场规模相对较小,仅有两三亿美元,这使得包括Marvell和博通等公司更专注于光模块类DSP或其他芯片,而没有投入资源开发针对AEC市场的小众芯片。这些高端芯片通常需要7纳米制程,开发流片费及研发费用可能高达数千万美元,但由于市场规模有限,他们选择不进入这一领域。
目前哪些厂商开始进入AEC市场?他们面临哪些挑战?
从2024年下半年开始,许多AI大客户开始大量采购AEC产品,使得包括博通、Marvell等公司也进入了这一市场。他们的网站上已经列出了几款用于光模块和铜缆用Retimer的新产品。同时,国内一些原本做无源铜缆的厂商,如博创科技旗下长芯盛、新易盛等,也接到了来自AWS等客户的大量需求。这些新进入者需要克服获取Retimer芯片以及提升生产能力等挑战。
国内厂商在参与竞争时具备哪些优势?未来发展前景如何?
国内很多原来做无源铜缆的厂商在看到AEC需求后,如新易盛、兆龙互联、瑞可达等,在获得Retimer芯片后,可以凭借国内现有线材生产能力(如乐庭等)迅速进入AEC市场。但国内厂商只是在尝试进入,尚在交涉、送样的过程中,还没有大批量出货,所以Credo目前仍是主要供应方,其订单量预计达到200多万条。原来他是找贸联进行代工组装,一年的出货量大概在80-90万条,但由于产能紧张,它正在寻找更多代工合作伙伴,如兆龙互联,以满足日益增长的需求。目前来看兆龙还是比较有优势的,因为他布局较早,很早之前就与字节和阿里合作定制AEC,且有自己的物理发泡设备,这决定了线材的生产能力。
来源:xueqiu日期:2025-01-11