
动荡的市场,更应该抓住紧缺的机会。
核心观点:
1.当前CPU市场呈现出普遍的缺货和涨价态势,主要由北美互联网大厂的囤货行为和存储厂商的供应控制所引发。英特尔 (Intel)第五代CPU缺货周期为2-4个月。AMD约有10-15个型号缺货,周期为2-3个月。
2.2025年中国CPU市场三足鼎立:英特尔占据约53%-54%的市场份额、AMD15%、信创系合计占据约32%的市场份额(华为鲲鹏60%,海光系30%,其他品牌10%)。
3.信创是政策市场,互联网大厂采购CPU权衡重点在性价比,国产CPU还要靠性能说话。
4.CPU的需求结构正在重构:未来超节点服务器新兴的超节点架构配比为1个CPU配2个GPU(1:2)(传统1:4),AI智能体(Agent)场景下,通用CPU服务器集群与GPU服务器集群协同工作,导致整体CPU与GPU数量比可能被放大至1:1甚至更高。
CPU需求展望
当前的情况是市场进入疯狂囤货的状态。
缺货具体情况,在去年Q4和今年Q1的时候,这两个季度英特尔第五代CPU的所有型号(一代CPU有五六十个型号),所有型号都缺货。到了目前,第五代CPU的缺货略有好转,基本上现在有二三十个型号缺货,缺货时间从3到6个月变成了2到4个月。第六代CPU也开始出现小面积缺货,有不到十个型号缺货,缺货周期是2到3个月。
AMD的情况,在售主要是第四代和第五代的服务器CPU,加在一起有差不多10到15个型号缺货,缺货情况比英特尔好一些,周期大概是2到3个月的时间。
涨价具体情况,英特尔的服务器CPU落地涨价,2月初跟所有的OEM厂商完成了价格沟通,所有厂商更新了他们的成本核算、订单系统、下单系统、报价系统。第一次涨价在2月底,涨幅按核心数区分,32核以下CPU涨20%,32核以上CPU涨10-15%。后续还会继续涨。
AMD为应对向2nm工艺过渡的成本压力,计划在2026年第二、三季度连续两次上调服务器CPU价格,累计涨幅预估16%-17%。
中国CPU市场竞争格局
2025年全年,Intel在中国区的市场份额差不多在53%-54%之间。AMD的市场份额差不多在15%左右。
剩下32%的市场份额全是信创系。
信创里边的份额基本上是鲲鹏和海光,2:1,华为系(鲲鹏系)占60%的市场份额,海光系差不多占30%的市场份额,剩下10%是其他品牌CPU。
CPU涨价核心驱动因素
核心驱动是两个原因:
一是因为北美的互联网大厂率先带动了一波CPU的囤货,引发其他行业的客户跟进。
二是存储厂商三星、美光、海力士联手的对整个市场上的内存和硬盘供应量进行控制,导致内存价格持续上涨的预期,以及内存、硬盘长期缺货的预期从去年Q4开始诱发,基本上比较多服务器需求的各行业的客户开始疯狂囤货。
这两个原因加一起,导致了服务器的CPU从去年Q3最后一个月到现在是一个长期缺货的状态。
未来产业端CPU和GPU配比趋势
两种理解方式。对于行业内人来讲,谈CPU和GPU的比,对于我们有技术上意义的比值,是要限定在同一台服务器之内,或者是同一个超节点之内的比例。如现在最主流的CPU对GPU比有两种,一种是发卡机,发卡机里是2个CPU带上8个GPU的一个模组,2比8就是1比4,这是现在占绝大多数最主流的一个配比。
从去年开始,一个新的机型开始迅速上量,就是超节点。国外的超节点主要是英伟达的NVL系列,NVL36、NVL72、NVL144,还有未来的NVL576;AMD在今年下半年马上要出AMD自己的超节点,叫 Helios 72。不管是哪家,这两家的CPU和GPU的比,在每一个节点里都是1比2,1个CPU,2个GPU。国内的超节点,包括华为的、曙光的,其他的像浪潮的、华三的等,超节点也都是1比2的配比。
1比1或者说倒挂之后10比1比值是因为在Agent AI火了之后,它的生命周期命令流程的特殊性,所有的指令并不仅仅是由GPU服务器进行处理。它的一个指定的生命周期里分成三部分,第一部分和第三部分都是由通用服务器的CPU处理,第二部分还是由GPU服务器处理。所以支撑Agent AI运行的服务器硬件环境,一般会有1个GPU服务器集群加上1个CPU服务器集群。所以很多自媒体文章,包括很多公众号上说CPU比GPU是1比1,甚至倒挂10比1等。那些都是把通用服务器集群里边的CPU加到一起,和GPU服务器集群里边的GPU去比,得出来一个更夸张的比值。
有意义比值是在一个系统之内CPU和DPU的比。如果用一个集群加另外一个集群的数量去比上GPU,这比例可以放大到无限大。如一个打卡机旁边放100台2路的通用服务器,CPU跟GPU就是200比8,比例可以变得很大。
多线程的未来趋势
未来,不管是做GPU服务器的机头,还是用来做公有云的算力的基础设施,或者承载Agent AI的通用服务器的集群,理论上来讲对多核数、多线程的需求会持续地增加。因为一个CPU支持的核心数越多,就代表着这颗CPU上能够承载更多的所谓的Agent AI沙箱。那样的话单台服务器里,能够承载的Agent的沙箱就会更多。这对于运营商来讲,是更有意义的指标。
海外CPU涨价,国内的厂商的机会首先在信创
从稀缺度来讲,国内的CST去购买英特尔和AMD的所有型号的CPU是没有任何限制的,而且从供应上,对互联网大厂的批量需求,相对会优先保证,服务器整机厂商对他们的涨幅比其他的零散客户还是要小的。
鲲鹏、海光属于信创的CPU。信创的CPU主要供应的是有信创指标的行业和企业。互联网行业目前是没有明确的信创指标要求,而且其他行业现在有绩效指标要求的行业主要是三个,金融、电信和政府。这三个行业他们购买信创的服务器或者IT产品是几乎不用自筹资金的,是国家拨款的。但如果是互联网行业,他们要去购买信创的CPU或者信创的服务器,他需要自筹资金,花自己钱那就会考虑到一个性价比的问题。
海光的CPU源自于AMD 2017年的第一代的同款,重新回到服务器CPU市场的第一代产品。海光经过了四次魔改之后,魔改到海光4号,它的性能相当于AMD的第二代或者第三代服务器CPU的水平,相当于第2.5代服务器CPU的水平。AMD现在最先进的是第五代CPU,也就是海光基本落后AMD最先进产品2代到2代半的差距。
从性能来讲,鲲鹏的CPU是基于ARM架构,性能还不如海光的CPU,包括生态上,也落后于海光的x86很成熟的生态。
这两家的CPU卖得都不便宜,按每核心数的价格,每核心数的成本,比英特尔和AMD的CPU都要贵。信创的IT产品卖得很贵,对于互联网行业来讲,他们没有什么动力去买信创的CPU。
互联网行业真正把钱花在哪些国产产品上?几家大厂都已经非常认可国产的GPU去做他们的推理的大规模的集群。一是在推理应用场景下,对英伟达和CUDA的依赖性没有在训练层面那么高,做推理框架切换是问题不大的。而且现在国产的推理卡,对比能够合法买到的英伟达在国内销售的卡来讲,性能其实也不弱。所有大厂都有灰色渠道能够去买英伟达的卡,但那种灰色渠道买来的东西,基本他们都要把那些钱留到去买英伟达最顶级的训练卡,如买B200、B300这样的卡,基本不太会把很宝贵、很稀缺的资源用来买推理卡。所以对互联网大厂来讲,他们现在对国产的CPU是一个完全开放且热烈欢迎的态度,但是国产CPU目前还没有看到有批量的采购或者上线。
三家CPU哪家强
从性能上来看,ARM和x86 CPU的本质区别是ARM的指令结构相对精简,CPU的功耗相对比较低,功耗低带来的一个负面影响是CPU的算力会相对比较低。
ARM更适合对单节点性能要求不高,但系统需要一个很好,很大的横向扩展的集群,适合用ARM的CPU。
作为x86 CPU,有各种不同的侧重,有的是单CPU的性能非常强,核数非常多,也有中低核数,可以进行大规模横向扩展的产品。


VIP复盘网