【中金科技硬件】DeepSeek V3.1对国产算力影响更新解读
【中金科技硬件】DeepSeek V3.1对国产算力影响更新解读
大家好,今日DeepSeek更新V3.1版本,市场对于官方号评论的“UE8M0 FP8是针对即将发布的下一代国产芯片设计”关注度较高,投资者关心此数据类型对国产算力有何影响,我们认为对国产算力需求影响正面!具体解答如下: UE8M0 FP8格式,U代表无符号优化,E代表指数位数,M代表尾数位数。 先前FP8的格式剔除掉符号位,一般的表示方式为E4M3或E5M2(即4位指数+3位位数,或5位指数+2位尾数)。 对存储需求的影响:我们认为不同的FP8格式实际上在存储单元的占用均为8 bit,实际上对内存单元以及内存带宽的需求并没有任何优化或者变化,因此部分公众号中解读的所谓利空HBM,降低存储需求的表述是明显错误的。 只要为FP8的格式,那么读写都是8bit的存储单元占用。 对算力需求的影响:不同格式的FP8对算力需求有明显不同。 由于在实际乘加运算过程中,要将指数位和位数位分开操作。 多的尾数位会明显带浮点乘法流水线的支持,会带来更多的计算单元的消耗。 尾数位越多,消耗的计算资源就越多(对应每个操作消耗的计算单元面积也就更大)。 我们认为,推出更灵活的数据格式UE8M0 FP8,是Deepseek通过更进一步的工程优化(类似采用FP8数据训练),针对国产AI芯片算力不足的问题做的优化(动态的去减少尾数可以使得更多的计算采用整数乘法器进行操作,可以较大程度的释放算力,在国产芯片设计端,未来在有限的制程下也可以塞入更多的整形计算单元来堆砌更多算力)。 在此趋势下,后续用国产卡训练大模型的可能性有望进一步增强。 我们从7月初开始左侧看好国产算力,发布了一系列报告并召开一系列电话会,8月以来市场已经表现出很强的认可度。 我们认为在DS等流量模型更新,供应链逐步完善,互联网大厂CAPEX投入持续的催化下,下半年国产算力链有望维持较好表现
大家好,今日DeepSeek更新V3.1版本,市场对于官方号评论的“UE8M0 FP8是针对即将发布的下一代国产芯片设计”关注度较高,投资者关心此数据类型对国产算力有何影响,我们认为对国产算力需求影响正面!具体解答如下: UE8M0 FP8格式,U代表无符号优化,E代表指数位数,M代表尾数位数。 先前FP8的格式剔除掉符号位,一般的表示方式为E4M3或E5M2(即4位指数+3位位数,或5位指数+2位尾数)。 对存储需求的影响:我们认为不同的FP8格式实际上在存储单元的占用均为8 bit,实际上对内存单元以及内存带宽的需求并没有任何优化或者变化,因此部分公众号中解读的所谓利空HBM,降低存储需求的表述是明显错误的。 只要为FP8的格式,那么读写都是8bit的存储单元占用。 对算力需求的影响:不同格式的FP8对算力需求有明显不同。 由于在实际乘加运算过程中,要将指数位和位数位分开操作。 多的尾数位会明显带浮点乘法流水线的支持,会带来更多的计算单元的消耗。 尾数位越多,消耗的计算资源就越多(对应每个操作消耗的计算单元面积也就更大)。 我们认为,推出更灵活的数据格式UE8M0 FP8,是Deepseek通过更进一步的工程优化(类似采用FP8数据训练),针对国产AI芯片算力不足的问题做的优化(动态的去减少尾数可以使得更多的计算采用整数乘法器进行操作,可以较大程度的释放算力,在国产芯片设计端,未来在有限的制程下也可以塞入更多的整形计算单元来堆砌更多算力)。 在此趋势下,后续用国产卡训练大模型的可能性有望进一步增强。 我们从7月初开始左侧看好国产算力,发布了一系列报告并召开一系列电话会,8月以来市场已经表现出很强的认可度。 我们认为在DS等流量模型更新,供应链逐步完善,互联网大厂CAPEX投入持续的催化下,下半年国产算力链有望维持较好表现
来源:xiaozuowen日期:2025-08-21