扫码关注公众号
网站公告:为了给家人们提供更好的用户体验和服务,股票复盘网V3.0正式上线,新版侧重股市情报和股票资讯,而旧版的复盘工具(连板梯队、热点解读、市场情绪、主线题材、复盘啦、龙虎榜、人气榜等功能)将全部移至VIP复盘网,VIP复盘网是目前市面上最专业的每日涨停复盘工具龙头复盘神器股票复盘工具复盘啦官网复盘盒子股票复盘软件复盘宝,持续上新功能,目前已经上新至V6.2.7版本,请家人们移步至VIP复盘网 / vip.fupanwang.com,另外,每周一、周三晚上20:00~21:00举办VIP复盘网线上实战课,由具有15年私募基金实战经验,精通龙头、短线、中长线等各种模式,熟悉游资操作的竹炜老师给家人们实战复盘,并讲解操盘技巧,每期只开放100个名额,请家人们快速联系客服报名!!! 点击访问_VIP复盘网

扫码VIP小程序
返回 当前位置: 首页/ 热点财经/ 华为云上线“核弹级产品”

股市情报:上述文章报告出品方/作者:财联社;仅供参考,投资者应独立决策并承担投资风险。

华为云上线“核弹级产品”

时间:2025-04-14 20:16
上述文章报告出品方/作者:财联社;仅供参考,投资者应独立决策并承担投资风险。

近日,华为公布了AI基础设施架构的新进展,推出CloudMatrix 384超节点,并已在芜湖数据中心规模上线。《科创板日报》独家了解到,华为云CloudMatrix384超节点今年上半年将有数万规模的上线。华为内部人士称其为核弹级的产品,或将彻底终结算力焦虑。未来,CloudMatrix超节点可以构建超过万片的大集群来提供算力

传统的AI服务器通常包括8张算力卡,一台服务器就称为一个节点。在服务器内部,这8张算力卡之间传输速度很快,但服务器与服务器之间的传输速度则慢得多。伴随大模型浪潮的到来,行业巨头需要连接起成千上万、乃至10万计的GPU算力卡,这使得互联和通信成了一个大麻烦。
如果能够采用高速通信技术把更多的算力卡融合在一起,成为一个超节点,那么超节点内的算力卡都可以实现高速互联和通信,就能大大提升算力集群的性能。
2024年3月,英伟达率先发布了NVL72超节点,可以把72张训练卡组成一个超节点,为万亿参数的大型语言模型推理提供了30倍实时速度提升。而这次发布的华为CloudMatrix 384更进一步,以384张昇腾算力卡组成一个超节点,在目前已商用的超节点中单体规模最大。
据悉,华为CloudMatrix 384在规模、性能和可靠性上对标英伟达NVL72,基于CloudMatrix的昇腾AI云服务,大模型训练作业可稳定运行40天,互联带宽断点恢复在10秒级别。在互联带宽上,超节点网络交换机采用6812个400G光模块,实现2.8Tbps卡间互联带宽。
《科创板日报》从硅基流动方面了解到,硅基流动已经联合华为云基于CloudMatrix384超节点昇腾云服务正式上线DeepSeek-R1,在保证单用户20TPS水平前提下,单卡Decode吞吐突破1920Tokens/s,可比肩H100部署性能同时,经过主流测试集验证及大规模线上盲测,在昇腾算力部署DeepSeek-R1的模型精度与DeepSeek官方保持一致。
目前,国产芯片与英伟达芯片在单卡性能方面仍存在一定的差距,但通过多卡集群后差距就会缩小。华为公布的数据显示,CloudMatrix 384实现算力规模达300PFlops,相比英伟达NVL72的180PFlops提升67%
不过,在单位算力功耗方面,国产芯片仍比英伟达高得多。
一位芯片业内人士对《科创板日报》表示,华为公开的数据没有提到CloudMatrix 384的算力功耗比。更高的功耗对于服务器散热要求也更高,机房规模会更大,导致整体成本上升。此外,算力卡数量较多的话,数据需要在多卡之间来回传输,会有更大的时间开销。
“当然即使在功耗更大的情况下,能做NVL72的水平也相当不容易了,体现了华为研发能力很强。”上述人士称。
国泰海通证券表示,华为云推出CloudMatrix 384超节点,单用户20TPS前提下,单卡Decode吞吐突破1920Tokens/s,比肩全球主流GPU部署性能,超节点机柜在集群推理方面具备优势。随着国内外硬件供应瓶颈逐步缓解,看好国内AI进展加速。

股票复盘网
当前版本:V3.0
扫码关注公众号
微信扫码公众号【VIP复盘】
免费注册领取14天VIP软件