英伟达新版blackwell流片结果2410

以下是专家观点:

Patrick:8月份英伟达修改过光罩,进了一次新的super hot run,听过10月中旬可能出流片结果,目前您是否有听说相关信息,效果如何?

专家:目前听闻流片进度相对顺利,最终需要大量跑来进行批量测试,得到统计数据,再来确定良率是否合格,当然目前尚未进行至此阶段,可能下个阶段就进行。目前看,光罩改良后,设计层面电路、线路改良后效果目测较好。当然上次听闻不仅仅是光罩问题,bridge die设计在两个晶片top上这部分也有不顺利的情况,因此英伟达也和TSMC团队一起工作看如何解决和改善,以让2个晶片中间的top更加顺利,减少频宽问题。关于warpage,应该得到一致,也选定了TC机器,可能是K&S,大约18台,用于CoWoS-L的Fluxless制程,其TC Fluxless目前听说已经qualified,所以应该不是ASM。

另外,CoWoS wafer的forecast预计在明年Q3~Q4翻倍,届时单CoWoS-L可能就达到每季度10万片。目前CoWoS wafer约300k/年,明年可能翻倍至600K~700K(其中600K的数字还未包含台积电所购买的群创南科四厂)。该数字建立在目前的预期进度上,但台积电也担心,因此边走边看,目前能见度只能看到2025年上半年,大约7月之前,而对于下半年情况台积电也并不清楚,具体量会扩产到何种程度还需看英伟达和AMD,前2个礼拜和AMD的人开会,他们比较乐观,架构也在修改。目前一些可以确定的是,AI之后的CPO会是一个主战场,AMD和英伟达目前也在设计其自己的CPO,目前铜线支撑的电流快到极限,因此可能要尽快上CPO,目前各家都有自己的CPO设计,也在和台积电去work这件事,例如台积电说的SoW(System on Wafer)这种新架构,是用Silicon Photonics去做。另外,DIE会走MCM,也一定会走chiplet。

AMD目前比较乐观,因为他们心里有底,主要基于其紧密地跟踪客户库存,他们一直在拜访头部CSP客户,咨询库存情况。但目前得到的return似乎不够多,因此AMD也会担心这是否会影响后期ROI、后续投片量、公司EPS和增速等问题,目前美国经济似乎也在下行,希望是软着陆,如果是硬着陆,这些可能会戛然而止,投资也不会如计划般那么多。因此AMD和英伟达都会紧密跟踪CSP客户,步步为营。

Patrick:回到之前return的问题,英伟达和AMD都担心客户砍单,您如何看待这个问题?

专家:个人也不清楚,可能类似当初的元宇宙一样,是一条不归路。当初元宇宙受益的也是英伟达,但后续元宇宙也没做出所以然,因此也削减很多。其实这将归因于未来CSP公司的EPS是否能够被justify、他们对于AI的投资是否有return,例如微软,在Copilot的财务回报上也不太敢呈现,虽然不知道盈利多少但个人相信如果其真正盈利很多钱,应该会体现在财报上,并大力宣传AI给其的盈利进而刺激下一波浪潮,但如果厂商计算不清楚或不敢批量AI的投资和对收入、EPS的贡献的话,就不清楚投资者或股东对这件事的想法,可能会基于EPS的压力而减少开支。

Patrick:通过和英伟达、AMD的沟通,您觉得他们的想法如何?

专家:他们认为至少至明年上半年都没问题,包括台积电也这么认为。但下半年情况如何尚不确定。当然,还有一个重要的因素是大环境,如果经济比较soft,公司也会考虑资本开支是否仍然持续保持这么高水平。

Patrick:AI是否能带来收入并非今年才有的问题,去年台积电扩产能时也会有这样的担心,但也依旧扩产能了?

专家:因为客户有明确的下单。另外,AI是新出的事物,前年开始从零起步,目前的量已经逐步建设起来,一年600K,这里600K是逐步扩产的,因此2025的600K在EQ时可能很多机器并未到位,因此到2026年时,量可能是25Q4的量乘以4,即210k乘以4,大概800K+,因此,台积电也认为800K的量可能是高峰期,除非客户有明确的需求,否则在当下时刻再增加很多量可能并不现实。

Patrick:是否能分享下一代Rubin的技术及CPO合封具体内容?

专家:CoWoS(SoIC)那张图上,上面SoIC代表SoIC的die,die的旁边有HBM,SoIC旁边堆叠的IO即Silicon Photonics。在3D Optical Engine for Next-Gen Communication那张图上,XPU代表CPU、GPU等,这个架构也有EIC、Silicon Photonics,旁边有HBM,也有可以COUPE的东西,这可能是其未来的架构。下一代AMD可能会走On Substrate的架构,即On-board那种架构。

在AMD CPO device structure那张图上,ABF substrate上方有PIC的wafer,再将EIC倒装上去,旁边有个coupler(俗称光引擎)通过UV bonding的方式装上去,旁边有Socket,Socket会bond在ABF substrate上。对于AMD的CPO演化路线,目前处于On-board的阶段,下一代是2.5D的CPO,再下一代是3D的CPO,也是目前台积电所做的第四代,这可能等到2027年。接下来一代是3D Co-packaged optics with integrated lasers,也就是第五代。以上都是网上公开资料。

Patrick:美光换了2次机台,目前结果如何?良率是否有改善?

专家:良率比较好,他们换成了Hanmi,大约10台设备,另外仍在继续采购Shibaura的设备,因为产能不够。Wafer的前道制程也换了供应商,SUSS似乎已经out,可能换成TEL。

另外memory在AI这边以后会是key player,而不是HBM,他们正在研究和关注新的方向,类似是做在Moblie的DRAM上的。HBM目前是众人嫌弃的对象。原本用于手机上的LPDDR的封装架构以及其前道突破的部分,以后不会主要放在HBM。以后无论EUV前道的纳米制程,还是后道架构大改的DRAM,还是下一代所有DRAM记忆体的cache core,会落在LPDDR上,这是因为目前用到的AI手机或AI电脑,由于缺少HBM,即使装载了AI芯片,也会遇到memory wall的问题。另外HBM已经确定是整个AI架构里最耗电的部分,因此业内有讨论用LPDDR去取代HBM,这些内容Jason在一场会议里提过。基于耗电的问题,存储厂现在在开发下一代LPDDR,它相对省电但可能频宽不够,需要靠前道纳米技术的突破。虽然LPDDR后续可能无法完全取代HBM,但可能会部分取代,进而造成HBM在后续某个时间点供过于求。

Patrick:是明年吗?

专家:并不一定是明年,而是当下一代LPDDR出炉并部分取代HBM的那个时刻,可能是turning ponit,这个LPDDR甚至可能用到Hybrid Bonding,这是一个很新的内容,业内正在讨论中,目前业内对HBM都比较嫌弃,耗电大,进而造成散热难的问题。散热一般包括风冷、液冷和浸没式液冷,如果浸没式液冷都没有办法解决散热问题,后续架构变大该如何解决呢?因此CPO、LPDDR是未来AI发展的关键所在。

匿名投资者:Rubin是否就会使用CPO来替换铜缆?

专家:有听说,但还未100%确定,取决于台积电CPO进度,目前有点不顺利,他们还在协作过程中。另外,AMD将CPO看做和英伟达的决胜点,因此AMD很重视CPO。

Patrick:英伟达目前两条路线都在进行,但是基于NV 72的问题较多,因此用CPO的可能性在上升,另外对APH的调研中,他们称英伟达尚未确定下一代不采用他们的产品,因此他们仍然在研发中。因此,英伟达可能暂时不会放弃铜缆,还是让供应商去研发,如果能做出来更好,毕竟铜缆成本低,如果不行,加上台积电的work,用CPO的概率会更高。

专家:个人听到英伟达还是想用CPO但台积电可能速度没有那么快。铜缆成本低但存在热、电力的问题。这可能是英伟达想走两条路径的原因,因为不确定性。

匿名投资者:B系列流片情况如何?RTO的die是否开始测试,还是需等至10月中旬才有结果?

专家:最后的final可能要等至10月中旬。

匿名投资者:Blackwell具体几月才能开始出货?

专家:个人听说12月份。

Patrick:10月中旬流片出结果,CoWoS大约1~2周,再加上测试、到达服务器厂商可能仍需半个月,个人觉得可能11月中旬或11月底可能有机会,但量可能很小,十几台的量级。

专家:对,批量出货售卖可能要等到12月,如果是第一颗那种早期的量11月份是有可能的。

匿名投资者:10月初B卡流片最终结果尚未出炉,目前去展望其结果是好的这件事概率有多高?另外10月顺利进入量产概率多大?

专家:流片结果是好的概率较大,但良率方面仍需做调整和优化。基于量产有很多阶段,关于high value那部分个人不是非常清楚,可能不会那么快在10月就量产。

Patrick:前道的良率应该还好?因为都是常规的工艺。

专家:其实台积电前道做到这么大die的良率也需要优化,基于英伟达和苹果的CPO良率其实相差挺大,英伟达的良率并没有非常高。

Patrick:有60%吗?

专家:60~70%,如果看其他手机客户前道良率都在80~90%。

Patrick:您刚提到CoWoS-L良率95%但UPH低,那低UPH是否会成为量产阻碍?

专家:不会,UPH低只是做得慢,但价格也更贵。UPH只会影响到价格、margin。但个人并不清楚其是否会基于这个因素来涨价。

匿名投资者:448G继续用铜缆的难度如何?是否可实现?

专家:个人觉得很margin,并不好做。个人听到AMD做CPO的原因也是因为铜缆很margin,因此其希望尽快转到CPO,以避免很多限制。否则AMD开发时如果突然要加上某些东西,或者频宽变大,那么铜缆不行的情况下CPO又没有准备好,可能就会很尴尬。因此,英伟达和AMD都希望用CPO而非铜缆,基于AI传输量越大,性能才越好,而缆线的电子速度不够快、电阻存在发热问题、耗电量大。目前很多CSP客户都提到耗电量的问题,希望能够得到解决。

匿名投资者:英伟达和AMD都在台积电做CPO,刚才您又说英伟达和AMD在CPO上迎来决胜点,请问AMD的优势在哪里?

专家:CPO很多都是其自己设计的,因此设计才是决胜点,制作才找的台积电。另外AMD也会逐步起来,但完全超过英伟达可能有难度,因为软件、生态差很多,CUDA还是很厉害的。

匿名投资者:台积电的CPO是否要等到2026或2027年才出来?届时光模块和光引擎厂商会扮演什么角色?

专家:AMD可能会找博通等原本做CPO和光引擎的公司,但可能只是将其买回来,真正决胜负的还是自己的design,design大部分是AMD和英伟达自己设计,而非ASIC或outsource,因此这些厂商顶多是供应商的角色,这些他们应该不会外传,因为这涉及整个系统架构如何配合的问题,有点类似上文所说的SoW(System on Wafer)的意思。

#【图文】纪要&数据&交流

来源:xueqiu日期:2024-10-09