AI光互联调研交流纪要

会议纪要 2024-04-16 10:04

Marvell AI DAY在投资者交流会上的业务展望是什么?

Marvell AI DAY在投资者交流会上表现出对AI相关业务的乐观指引,预计其加速业务整体营收将从FY2023年的2亿美元增长到2024年的5.5亿美元,实现翻倍以上的增长,并且对未来几年的财年也给出了较为乐观的预测。此外,Marvell还介绍了其在数据中心互联领域高速率光模块和芯片产品的创新和发展情况。

Marvell AI DAY计划如何加强在AI营销换方面的投资?

Marvell计划在12.8T交换机芯片产品方面实现大规模量产,并计划在2024年夏季推出51.2T交换芯片,进一步加速AI互联技术的发展。

Marvell预计AI互联速率会有什么样的提升?

Marvell预计AI互联速率将以更快的速度提升,从过去的四年两倍变成两年两倍,同时光模块的速率也在从400/800G向1.6T和3.2T更高速率过渡。

Marvell如何看待AI大规模集群对光互联的需求?

Marvell预计随着AI集群规模的扩大,如从1000张SPU集群发展到百万级别的集群,将带来对光互联更高需求的增长,从1:2提升至1:3,甚至更高比值,同时网络前端和后端都需要大量光互连技术的支持。

Marvell AI DAY在AI业务营收和光互联预期方面有何具体表现?

Marvell AI DAY在AI业务营收指引方面表现乐观,预计2024年AI相关业务营收有望超过15亿美元,2025年超过25亿美元。同时,对于光互联技术的需求也预计会有显著增长,从而推动光通信产业链的发展机会。

Marvell公司的长期目标是什么,特别是在市场规模增长的背景下?

公司的长期目标是在市场规模增长的基础上,将市场份额从去年的10%提升至20%。他们专注于加速集团定制领域,通过构建强大的基础设施技术平台和掌握先进的芯片工艺能力、丰富的IP资源以及硅光等技术,在AI加速芯片、安全网卡、DPU、基于ARM架构的存储等多个定制芯片方面提供产品,并强调与美国三大数据中心客户的紧密合作关系。

Marvell公司在数据中心互联方面的业务布局是什么?

在数据中心互联方面,MB公司主要提供DSP、驱动器和TIA等芯片产品,应用于8*200G的1.6T光模块,并积极构建AEC DSP产品生态系统。同时,他们保持着在数据中心内部前端和后端网络方面的领先地位,并计划推出12.8T交换芯片,并计划于24年夏季实现51.2T交换芯片的量产。此外,公司的产品可覆盖约120公里的距离,并通过PCS技术扩展到1000公里,预计潜在市场规模为10亿美元。

Marvell公司在交换领域有哪些投资计划以及未来的产品预期?

公司计划加大在交换领域的投资,目前已实现12.8T交换芯片的大规模量产,并计划在未来推出51.2T交换芯片,预计于24年夏季实现量产。

对于光互联技术在未来通信领域的应用前景有何看法?

认为光通信作为通信互联解决方案,在底层技术优势上具有大带宽、低损耗和抗干扰能力强等特点,是通信领域主流且未来的重要发展方向。特别是在AI快速发展背景下,对于人工智能基础设施大量投资加速创新解决方案以满足需求,同时也需解决成本和功耗挑战。

针对AI加速互联速度的发展趋势有何解读?

AI加速互联速度在过去两年间实现了倍增,由过去的四年两倍提升为现在的两年两倍。同时,光模块连接数也从400G向1.6T甚至3.2T高速方向发展。

AI大规模集群对光连接需求的增长态势如何?随着AI大规模集群的发展,对光连接的需求呈现快速增长。例如,预计十万级和百万级AI集群分别需要五层和十层网络架构,且随着AI模型的迭代升级,光学互联的增长速度显著超过AI集群的增长速度。

对于微软Stargate超级计算机计划的看法是什么?

微软计划建造的Stargate超级计算机是目前世界上最大、最先进的数据中心之一,主要用于更先进的AI模型训练,预计将在2028年推出。这一计划进一步证实了大规模集群是未来重要的发展方向。

大规模集群如何带动光互联发展?

大规模集群在跨地区数据中心互联方面的需求显著提升,进而推动了光互联技术的发展。AI训练和推理对于集群存在差异化需求,其中训练时需要大集群,但整体数量较少;而推理时则需要更多小集群,数量庞大。这两种应用场景都会驱动大量光互联基础设施的建设。

AI发展如何影响电力、选址及数据集中心建设?英特尔Gaudi 3 AI加速器有何特点及优势?

AI发展不仅需要更多的电力和资本,也会带动更多数据集中心的建设。选址也面临新一轮基础设施建设的压力,这些因素整体上会推动新一轮基础设施建设,包括数据中心在内的相关领域。英特尔的Gaudi 3 AI加速器采用5纳米工艺,其AI算力相比上一代产品提升显著,可实现系统大规模横向扩展,在主流大模型中的性能表现优异,并在推理速度上有所提升。该产品包括OAM兼容夹层卡、通用基板、PCIe扩展卡,预计在今年三季度上市。

AI加速器的发展对整个AIGC产业的影响是什么?

AI加速器的不断发展有望缩短模型训练迭代时间,加快推理速度,助力AIGC产业不断成熟。此外,AI算力芯片工艺的上升将推动从风冷向液冷散热的切换,建议持续关注电热温控领域。

Marvell提出的三种网络架构连接方式是什么?Marvell提出的三种网络架构连接方式分别是:计算机内连接,主要使用铜缆连接服务器内的SPU;集群内后端连接,通过XPU网卡或DPU端口进行光缆连接;前端连接,将服务器连接至数据中心,通过CPU网口和DPU端口进行光缆连接。其中后端和前端网络连接均需要大量光互联支持。

大规模AI集群如何推动远距离互联的需求?

随着大规模AI集群的发展,尤其是跨地区数据中心之间的互联距离可能从不到2公里增长到10到20公里,从而引发了对具有相干技术长距离传输特性的相关技术发展的需求。