国产GPU好利科技交流纪要
您是在三星的代工厂?
三星的很多产品有在韩国生产,有在中国生产的,包括前段、后段、对接客户等等。我们这边是给一些客户做代工以及产品卖给客户的对接工作。我负责这一块以及技术相关。
您是在哪座城市?
苏州。三星在中国工厂有西安和苏州,人员分布可能各个地方都有。
您这边是直接对接好利还是曲速?
曲速。英伟达我们也有对接,也有跟韩国一起的情况。
合肥曲速的芯片情况?
合肥曲速找我们代工,已经四五年了。7nm的流片数量不是很多,在我们这边主要还是供28nm和14nm比较多一点。英伟达的H100和A100分别是4nm和7nm,以前也是找我们三星,后来因为号称是良率问题或者是跟不上它的问题,后来他转投了台机电,但是包括壁仞等等还是找我们三星在做,壁仞的BR100实际上是也是7nm。曲速/好利这边的7nm产品还在前期的开发阶段,但是订单已经有了。去年以前,他们给我们的感觉是主要偏重于中端而非高端的GPU算力市场,比如民用或军用的普通计算。但是去年以来,像国内百度文心一格以及ChatGPT这种东西出来以后,他们给我们的战略发展规划要进军数据中心和智能芯片AI芯片,所以对于算力的高需求下,他们必须依托于7nm制程。
他们有一些订单想找台积电,但是他们的订单对台积电来说不是特别大;三星这边,晶圆代工属于三星foundry部门,以前附属于半导体部门,但现在属于平行于半导体部门的代工部门。三星在中国市场,如果有客户在AI领域,比如昆仑芯,我们是愿意合作的。曲速如果订单能够持续,比如说两年以内都有订单,很小也无所谓。我们收到的战略指示就是跟他们保持长期合作关系,可以囤一部分产能给他们。
他现在7nm已经有订单?
给我们的订单是有的,但是还没有流片出来。
单子大概多大?
7nm的订单分了几个阶段,首批订单大概是7k片12寸wafer,1片上100~300个die,平均200个。
这是下了多久的订单?
一年半的订单。他给我们三个阶段的,首先一年半以后就是到明年上半年左右的订单,然后到二五年年底的订单追加到总共两万片水平。
第一批啥时候出来?
首批0.7W应该到今年的Q3和Q4之间。
他7nm的改版几次了?
改版现在目前为止只有一次,还比较慢。他预计应该还有几次。他大概两个月左右改版一次,最长三个月最短一个月。
他单价能多少钱?
单价主要是产品采购部门了解,我不是很清楚。以我的了解大概一片晶圆接近20万人民币左右。
曲速7nm的芯片,跟国产及国际上同行的性能比较?
国际上,比如英伟达,虽然曲速使用了7nm制程,但是算力预计跟英伟达的A100差了大概20%~30%,但是曲速的价格要低。代工方面,曲速无非是找三星或者台积,中芯国际目前7nm的良率比较低,GlobalFoundry也有可能。虽然代工没有问题,但是它性能算力以及和x86/ARM/MIPS的兼容性目前应该差了英伟达一代到两代。
国内角度,景嘉微不及曲速,他是走军工的,然后现在开始转民用。兆芯和芯动科技这两家,包括兆芯的arise系列比如说GT10C0,芯动科技的风华1号2号3号相比,则曲速比兆芯和芯动差一点。初创公司如沐曦,他们直接就上的是7nm的工艺,本身资本投入比较大,直接就干高端的这种东西,从技术革新角度曲速不及,但从订单量或者性价比角度来说,曲速要更厉害。从技术角度,芯动/兆芯>曲速>景嘉微;从赚钱角度,芯动>曲速>兆芯/景嘉微。
沐曦能排在什么位置?
从技术上讲,基于他们宣传和推出的产品,应该排在跟芯动差不多;从资本投入角度,和景嘉微平行,落后于曲速、兆芯、芯动科技。
这里比较的是图显还是AI训练芯片?
用于数据中心的AI芯片。景嘉微是图显强一点。
摩尔线程跟壁仞怎么样?
摩尔线程创始人以前是NVIDIA的副总裁,但目前摩尔线程和曲速差不多相同水准,而且按曲速目前的发展速度会被曲速超过。三星跟曲速打交道下来,曲速的资本投入更高。
壁仞是国内top1,特别是BR100现在国内用的也是比较多的,基本能完全替代掉被禁的H100、A100,虽然使用的是7nm制程。
能介绍一下曲诉这公司的背景还有科研实力吗?
曲速是好利分出来的,现在在合肥有公司,之前主攻中高端GPU。CTO孟海波之前是中科院计算机结构博士,所以起初基本上是一些国内的研究所或者院校科研单位过去先把组织架构给抬起来,后面也挖了一些人进行技术攻克,他从摩尔线程、英伟达和芯动挖了一些人过去。他在合肥政府和好利科技层面的融资情况比较好,也搞了很多IP包括专利。
以前本来是一个很普通的公司,但是趁着这一波资本投入,以及数据中心的发展趋势,ChatGPT和GPT3的出现对CPU、GPU关联算力的需求提升,大家对他的关注越来越高。加上最近国内的互联网公司包括百度昆仑、华为云、谷歌、亚马逊都在搞智能芯片,曲速正好就是赶上这一波,滚雪球可能越来越大;正好三星想在中美摩擦的时点进来,而台积电受美国的约束也比较大,所以就是说曲速在前端的供给和后端的需求都比较好。
曲速的最大问题是他以前的28nm和14nm的体量不是太大,而GPU需要终端客户检证其计算能力,需要比较大的量。曲速和壁仞以及摩尔线程的订单水平等相比可能50%都没达到,可能以后还要持续检证,同时也要经过我们晶圆厂对于他们设计能力的检证。
检证是什么意思?
(1)数据中心或者智能芯片的AI计算主要依靠GPU、CPU、内存。比如用英特尔的CPU时,GPU产品输出只有70%或50%,证明算力有问题,这就要检证。
(2)三星本身只是晶圆代工,但如果芯片设计本身影响了制程的良率或者产线的兼容性,最后的价格虽然低但是影响了三星的整体供应,三星就需要去检证产品设计。
平时找您聊曲速的人多吗?
专门聊曲速这家公司的,你们是第一家。之前很多家一般是聊整个市场,包括最近的ChatGPT、内存接口芯片、存储市场、晶圆代工等等,还有聊台积电和三星的代工能力、整个国内市场比如长鑫存储。前段时间12月和1月有三家聊英伟达被禁的事情,也有谈及壁仞。
曲速看上去体量不大,账上用于流片的资本金够吗?
曲速应该是有资金实力的。一方面好利给他的融资是慢慢上涨的。另一方面,合肥政府给他融资,合肥正极力发展半导体,像合肥有个长鑫存储(长鑫存储非GPU行业,产品主要是存储芯片,而GPU是逻辑芯片)。曲速应该在合肥是TOP3的重大项目。
听说有国资可能要给他一些投资?
如果是比合肥政府更高层级的国资,我还没听说过相关消息。三星跟曲速的交流下来从来没担心过钱不够的问题,更关心他最后的订单客户。我认为只要曲速没有发生贪腐或者政治问题,资金上的问题不大。虽然他们现在差钱,但是能融到钱。
曲速和沐曦都属于刚起步的阶段,规模不大。但从市场看,曲速的切入点正好非常合适,他的相关股价也很有希望。
曲速的封测是在哪做?
目前国内最大的封测的话有三家,通富微电、长电科技、天水华天。曲速目前找了长电和华天,但通富以后应该也会去看,因为通富在慢慢渗透GPU行业,他们的技术也比较好。封测主要还是看技术。我听说曲速已经在跟通富谈。
锐杰微您听说过吗?
这种应该都是非常小的,不了解他的订单情况。
ABF载板是不是比较受限?
ABF载板不光是曲速受限,整个行业在2022年Q1之前都非常紧缺。那个时候在比如说台湾UMTC(欣兴),内地的SCC(深南)和FASTPRINT(兴森)这几家载板商,三星都有可能叫不上号。但是曲速订单不大所以在Q1受到的影响不算太大。Q2以后,载板商纷纷扩建产能,从4000平方产能扩到8万平方都有,所以现在载板不缺了但仍然紧俏。
听说他们一片Wafer只能切出不到100颗?
28nm占用的面积大所以少,7nm占用面积小所以数量就会比较多,这也是往先进制程发展的一个原因。
曲速之前在三星流了14nm的?
有的。他的14nm不是用在数据中心,好像视频监控和车载上有用。曲速以后7nm的也会在车上用,当时是只能做14nm。智能驾驶市场是非常大的,像特斯拉HW4.0、蔚来NIO都在做,还有车机互联等,三星也在往车规市场渗透。曲速的7nm主推车规市场,其他市场很难,而车规市场已经有一定的客户。
听说他们还要做5nm的?
所有人都想做5nm,包括摩尔线程、芯动、兆芯、英伟达(英伟达已经有5nm实力,4nm也已经搞出来)。5nm现在能做的只有三星和台积电,GlobalFoundry也能做但是受美国制约比较大,中芯国际做不出来。
他们现在还不太能做5nm,(1)曲速目前的设计能力还没有达到5nm,而且订单比较少的话晶圆代工厂这边不会去给他做;(2)曲速本身也不会这么激进,7nm还没搞出来就往5nm去;(3)三星在5nm的良率在去年以前不到50%,今年是70%,台积电要稍好一点,在良率这么差的情况下,成本就摊到客户身上,单价比较高的话曲速也扛不住;三星也没那么多产能给他们。
您知道他们研发人员就是大概有多少人?
研发人员应该有170多个。
跟咱们对接的主要是有多少人?
跟我们这边对接的主要是向后的技术和订单的发展战略规划,加起来大概15到20个人左右。其他的一些人主要是跟我们其他部门对接或者是不用出来对接的人。
您觉得这15到20个人水平怎么样?
他们现在的压力非常大。(1)以前从国内的研究所或者大学院校过来的比较多,后面挖了一些人,以前的员工感觉到能力不足,现在积极性提高压力也上来。(2)领导定下的战略目标非常具体化的,有时候开完会他们和我们一起吃饭会抱怨说领导给他们的节点指标精确到数字。但这不妨是一件好事,当年华为也是这么起来的。他们最近在整个上下游的沟通比较频繁,技术力方面以后会挖更多的人,专利申请方面也会布局,最终布局往壁仞和摩尔线程靠近。
它这个7nm的这个芯片能直接就在数据中心上用吗?
我认为可以,至少结合百度、华为云或者平头哥是可以的。他们继续保持价格优势,并坚持目前激进的做事方式的话最后应该是能成功的。
他们需要考虑的是防止在终端客户层面发生品质事故。我们以前接触到过,IDT(Integrated Device Technology,已被瑞萨电子RENESAS收购)做内存接口芯片的,在终端客户那里发生了品质事故,这就是跟他们算力设计有关系。如果曲速有十个客户,其中三个客户他就需要投入更多的人去跟进,包括驻场,确保在终端客户那边没有问题。他们做好这件事就没问题,否则风险很高。
他的7nn芯片是GPGPU?
是的。他的自动驾驶芯片目前还没有看到。
咱们不管他的IP?
不管。
刚才说一片晶圆20万,他一片切100多颗,300颗,单颗就上千块钱?
我刚才说的是整个卖的价格,我们收他们家没这么贵,估计30%都不到,一片应该8万多人民币。
那如果1000多元一颗芯片,在GPU里面什么水平?
不会到1000元那么低,一个GPU很贵,7nm应该要几千到一万多,绝对卖出来不是1000块钱。
咱们给那个曲速的账期大概几个月?
他们这次下的是一年半的订单,但是一般情况不会超过六个月的订单量,交付期我们是一般按照三个月左右交一批货的基准。
大概在今年的十月份第一次开始交7nm的货是吗?
对,十月份应该会交第一批货。但这一次的量比较少,应该只有0.2~0.3w片。
您刚才说的是二十万一片是售价?
不是,这个是折算,把成本摊到晶圆上去算的话大概要二十万人民币一个。我们去给他一片wafer做成芯片就是大概8万人民币。
7nm这个除了数据中心还有其他应用场景吗?
第一个data center,第二个自动驾驶SoC,第三个ChatGPT的 AI。
英伟达的A100能卖到1万美金一颗?
刚开始卖的是1万,后来降了很多。现在看不到A100了,要看A800,A800这几天可能应该是1万美金。价格要看单颗算力,因为一台服务器上面可能有成千上万颗。
曲速这颗7nm能买到三五千块钱?
我猜应该要上万元人民币,他没有公布。
他的芯片后续能衍生的场景有哪些?除了刚刚说的数据中心和自动驾驶。
很多,消费电子端的手机和VR里面也行,只要跟智慧性或者物联网相关的东西都有可能涉及。车载或数据中心在爬坡阶段,所以目前主要还是集中在这两块。
他的芯片在自动驾驶可以应用到L几级别?
他们说的L4应该也支持。
曲速第一颗芯片是用在网信网安这方面?
它第一颗芯片是那么干的,不是很先进。曲速正好趁现在这个机会搞GPU方向,如果他往以前的那个方向走就像海康卫视了。
他7nm的GPU可以对标英伟达哪个芯片?
对比A100性能要差20%左右。跟RTX系列就不是很好对比。
曲速的良率能到多少?
他们最终生产出来的不是很清楚,也不会告诉我们。三星自身的良率是80%。
咱们有和他们技术交流过用在车上的芯片吗?
技术交流就是指:一般情况是我们去给他们搞一个战略,因为三星要树立每年晶圆代工的订单情况,然后他们跟我们说往车载或数据方向去走以及大概算力是什么样情况,但是比较宽泛,每个分支或者model型号没有涉及。
7nm这颗GPU的DRAM是外置的还是集成在里面?
所有的GPU本身里面有一部分DRAM功能,但同时又需要外部独立的memory/DRAM。所有的CPU和GPU本身内部有一块单元有缓存功能,但这个缓存不具备完全应对外围接口的数据的处理能力,所以必须得搭配外面的memory,比如三星、海力士、镁光的DDR5或DDR4。目前的GPU还没有达到脱离独立的DDR,仅靠内部DDR满足需求的程度。
他下了这个订单量在国内的GPU里面算什么水平?
不算大。芯动比他好一点,摩尔还可以,沐曦稍微多一点点。
海光是在咱们这儿吗?
停了。目前是临时的hold或pending状态,三星仍把他当作客户,不是战略上排除。
所以把ABF载板都给腾出来了?
是的。
曲速后面有没有一些更先进制程的单子想往我们这边放?
曲速目前是7nm,但是肯定要往5nm或者4nm走,对于三星来说,4nm和5nm其实在性价比方面其实差不多的。他的5nm如果放单,大概率是三星这边单子比较大。曲速希望争取到台积电,但是不一定成功,而我们三星非常可能去给他投入。
曲速有跟你们提过更先进制程方面的计划吗?
目前重点7nm。5nm在他们的一个战略文件里面说到了,但是他们排在了二五年,现在可能还说不清楚。
曲速7nm的已经点亮了吗?
应该还没有,现在刚开始流片。点亮就相当于流片什么都搞得差不多了,应该要到七八月份可以第一次点亮,后面再去持续流片看看。
去年跟他们聊,他们说也在接触台积电,那现在是还没有接触是吧?
台积电他们一直在接触。台积电最近说晶圆代工降价,为了拉客户产能。但我觉得台积应该看不上。
台积电的12寸良率大概多少?
大概87%,因为他们比我们早干了大概半年左右的时间,而且本身三星的订单量没他大,这个要经过终端客户的订单的检证的情况。
三星和台积电代工价格对比?
三星要便宜5%左右。两家还是垄断的,也不会便宜太多。