国产GPU的DS时刻!
时间:2025-02-25 18:11
上述文章报告出品方/作者:研讯社;仅供参考,投资者应独立决策并承担投资风险。
第一,DS的普及以及本地私有化部署驱动算力需求,以英伟达4090为代表的显卡出现供不应求,价格暴涨,国产卡性价比提升。DS降低了算力的门槛,部分高端消费级显卡也能运行大模型,比如本月清华大学KVCache.AI团队公布,实现4090D单卡运行满血版DeepSeek-R1满血版模型,这进一步促进了4090显卡的使用率。
但由于英伟达于2024年10月/11月正式停产RTX 4090,为RTX 50系列让路,导致库存快速耗尽,所以4090显卡出现缺货,虽然官方价格是1.3万,但实际上中国市场的价格已经超过5万元,接近官方售价的4倍!大致梳理下部分显卡的性能和价格(数据来源于DS):
【英伟达4090】算力82.6(FP32)、显存容量24GB GDDR6X、功耗450W、价格>5万;
【英伟达H20】算力296(FP32)、显存容量96GB HBM3、功耗450W、价格11万;【昇腾910B】算力256(FP16)、显存容量64GB HBM、功耗310W、价格12万;【思元MLU370】算力256(FP16)、显存容量64GB HBM、功耗350W、价格10-12万;
【沐曦MXN100】算力128(FP16)、显存容量32GB HBM、功耗300W、价格6-8万;
【燧原S60】算力128(FP32)、显存容量64GB HBM2E、功耗350W、价格10-12万;
【云燧T20】算力40(FP32)、显存容量32GB HBM2E、功耗300W、价格6-8万;
【天数智芯智铠100】算力256(FP16)、显存容量32GB HBM2、功耗350W、价格10-12万;
【摩尔线程MTT S80】算力14.4(FP32)、显存容量16GB GDDR6、功耗215W、价格0.3万。根据性能和价格对比可以发现,在英伟达显卡大幅涨价之后,国产显卡将具有更高的性价比,尤其是在整体显卡紧缺的背景下,国产显卡有望迎来放量。私有化部署推升的一体机景气度有望蔓延至上游国产显卡。第二,DS持续开源“黑科技”,推动AI平权,国产卡性能潜力将被激发。昨天是第一天,发布了FlashMLA,通过软件的重塑,进一步强化了算力卡的性能,相当于给算力卡吃了“大补丸”,彻底激发了其性能潜力。原来一个低性能的卡就能当更高性能的卡使用,用相同的GPU服务器完成原来几倍的任务量。国产卡沐曦迅速响应,仅用2小时即完成与沐曦图形处理器的适配工作,并于当日将代码提交至开源社区。FlashMLA与国产显卡的结合,将激发国产卡性能潜力,进一步提升国产卡的性价比。