英伟达CEO黄仁勋对美国封锁芯片出口深感焦虑,因为他知道目前中国的国产计算率已经达到了什么水平。
不久前,华为推出了CloudMatrixAI算率集群解决方案。 384,这在外行人看来似乎没有什么不同,但是如果仔细分析它的影响是长期的。
按照华为的说法,CloudMatrix 384基于384颗升腾芯片的构建,芯片之间的高效协同可以通过全互连拓扑架构提供高达300个。接近英伟达GB200的PFLOPs密集BF16计算率 NVL72系统的两倍。
此外,CM384在内存空间和带宽方面也有优势。总内存空间是英伟达方案的3.6倍,内存带宽是英伟达方案的2.1倍,为大规模AI练习和推理提供了更有效的硬件支持。
尽管单颗升腾芯片的性能大约是英伟达Blackwell架构GPU的三分之一,但华为通过大规模系统设计,在超大规模模型训练、即时推理等场景中,成功地实现了整体计算率的跃升。
据海外投资银行称,华为的大规模解决方案“领先于英伟达和AMD目前市场上的商品一代”,认为中国在AI基础设施方面的突破将对全球AI产业结构产生深远影响。
赞一个