【DW电子】我们为什么看好Scale up交换芯片?

【DW电子】我们为什么看好Scale up交换芯片?
(有点长且稍硬核,但很干货)推荐:盛科通信,澜起科技,万通发展为什么PCIe交换芯片在CPU GPU互联上是必选? 在现有计算架构中,CPU、GPU 以及 SSD 等芯片的 I/O 端口数量有限,一方面如果没有交换芯片,端口数量会直接限制整体系统的互联带宽。 另一方面,当前大多数CPU仍基于x86架构,而英特尔主导制定的互联标准是PCIe协议,因此在CPU与GPU互联场景下,几乎都需要依赖 PCIe Switch芯片。 只有像英伟达、AMD这样同时具备CPU和GPU研发能力的厂商,才有机会推出类似NVLink C2C这样的自定义互联协议,绕开PCIe的限制。 所以在现有市场中,CPU与 GPU的互联大多采用博通的PEX系列PCIe Switch芯片。 Astera Labs也有布局PCIe Switch产品Scorpio,正在逐步导入到AWS、AMD客户中,但其以往的核心产品还是PCIe Retimer,主要用于延长链路距离、修复信号完整性,而非真正的交换功能。 为什么以太网交换芯片更适合GPU GPU之间的Scale-up互联? 在GPU与GPU的互联(Scale-up)场景下,各大AI芯片厂商都希望复制英伟达NVLink的成功,建立自己的互联壁垒。 但由于自研高性能互联协议难度极大,仍存在留给第三方厂商的机会。 而在这一领域,不同厂商各有优势:博通一方面拥有如类似PEX89104等PCIe Switch,可以覆盖CPUGPU互联场景;另一方面,其以太网交换芯片产品线更为成熟,Tomahawk Ultra系列在带宽和延迟上都具备优势,因此在GPUGPU Scale-up 互联市场潜力更大。 而Astera Labs、澜起原本在PCIe Retimer 技术上积累深厚,基于此切入PCIe Switch研发是顺理成章的路径。 但是在PCIe Switch与以太网Switch 的比较上,一个关键差异在于 PCIe 协议极其复杂,迭代速度远慢于以太网协议。 这意味着在AI集群高速演进的背景下,采用以太网协议的Scale-up交换芯片更具优势。 综上,我们可以把整个在AI服务器内部的交换芯片市场分为两部分:第一是CPUGPU互联的交换芯片:由于 x86 CPU的PCIe协议限制,短期内仍必须依赖 PCIe Switch。 代表产品包括博通 PEX89104/PEX89144,以及ALAB的Scorpio。 国内替代厂商有数渡科技、中兴微等。 第二是GPUGPU Scale-up 互联:关键在于能否匹配 AI 芯片迭代的速度。 这里以太网交换芯片展现出更大优势。 海外有博通 Tomahawk Ultra,而在国内,盛科已推出51.2T 级别的数据中心交换芯片,并正在研发对标Tomahawk Ultra可用于Scale-up产品。 鉴于盛科在园区网市场已具领先地位,这一方向很可能成为其未来几年业绩增长的核心驱动力。 过往的国产8卡AI服务器,要么不具备卡间无内阻互联的能力,要么就是简单粗暴的full mesh点对点互联,面向未来的大规模训练场景,Scale up是必须要走的一步。 所以对于投资人而言,Scale up交换芯片也属于是一个新增量的逻辑。 无论是直接打开未来市场空间的盛科通信,还是在做PCIe Switch的数渡科技(万通发展),还是从PCIe retimer走向PCIe Switch的澜起科技,我都是重点看好,具体情况欢迎与我交流。 【DW电子】我们为什么看好Scale up交换芯片?
来源:xiaozuowen日期:2025-08-21