昇腾追踪①①:华为的“核弹级

昇腾追踪①①:华为的“核弹级产品”——CloudMatrix384超节点

[烟花]
1)硅基流动基于CloudMatrix384部署DeepSeek-R1 ,单卡Decode吞吐 1920 Tokens/s,
2)华为云CloudMatrix384超节点25H1将有
3)需6812个400G光模块,卡间互联单向带宽达350GB/s以上
4)CloudMatrix384超节点算力规模达300 PFlops,对应单卡算力0.8P(

一、啥是超节点?
【定义】超节点是一种通过高带宽、低时延互联技术(如NVLink、HCCS、OISA)将多张GPU互联在一起的架构。
【特点】内部通信速度可达数百GB/s及以上,远高于以太网/IB网络带宽。可降低通信时间,提升GPU运行效率
【备注】所谓的“8卡”、“机柜”、“Rack”都属于超节点,只是规模不同

二、谁在设计超节点方案?
#GPU厂商、国内云商、服务器都在尝试更大规模的超节点
【GPU厂商】GB200 NvL72、CloudMatrix384
【云商ASIC】Trainium2*64卡、阿里平头哥
【云商+服务器厂商】信通院&腾讯牵头ETH-X项目(以太网协议、原型机近日点亮)

三、CloudMatrix384超节点的架构?

双层胖树架构
910C——Layer1交换机,采用 连接
Layer1交换机——Laye2交换机,采用 连接,GPU:400G ≈ 1:18

四、供应链什么环节受益?
1)服务器代工,代工价值有望提升,关注
2)光模块,GPU:400G ≈ 1:18,关注
3)铜连接,高速线模组放量,关注
4)液冷,GPU密度提升,关注

(长江通信于海宁团队)
来源:xiaozuowen日期:2025-04-15