评级:增持(维持)
投资要点
CPU供应不足,供应商预计将上调价格:受超大规模云厂商需求驱动,英特尔与AMD计划于2026年上调服务器CPU价格10%-15%。为确保利润,英特尔将核心先进制程产能大规模从消费端转向服务器,导致全球PC交付保证率大幅下滑,低端PC市场将面临供应不足。
AI热潮抬升原材料,CPU成本上升:CPU部件PCB应用及加工材质的转变,使得钻针使用寿命缩短,消耗量暴增;CCL采用的树脂体系、玻纤布与铜箔匹配复杂,新进入者良率提升缓慢与客户认证周期长,导致有效产能释放缓慢;二者纷纷涨价,带动CPU价格上涨。
AI推理和Agent发展迅速,拉动高端多核CPU需求:CPU负载正从“人类节奏”转向“机器节奏”。 Agentic AI远不是单次推理,而是动态推理 多步决策 外部工具调用的循环,这比传统大模型调用更耗资源、负载更复杂、成本更高。这种资源调用增长,加之为了安全防范而产生的高频沙箱隔离开销,使得CPU资源消耗呈现指数级放大。Deepseek提出Engram模块,提升CPU用量。
CPU产能从消费级向服务器级转移:在英特尔 2025 年第四季度电话会议上,公司财务官表示“正在尽可能将产能转向数据中心以满足强劲需求”,表明在供应受限情况下英特尔优先满足服务器端需求。KeyBanc等机构报告也指出,2026 年服务器CPU产能已基本售罄,公司将部分产能从 PC端调配到服务器CPU以缓解供不应求。AMD在2025–2026年的服务器CPU市场份额快速增长,表明其正在将资源与产线重心从传统消费端向服务器、数据中心倾斜。
投资建议:AI Agent落地速度正逐渐加速,其带来的沙箱创建、负载卸载等需求有望大幅拉动CPU的需求。但同时,全球算力供应链产能紧张,多个环节涨价,使得CPU制造成本增加。两方面影响下,我们认为CPU产业有望迎来大周期。
风险提示:Agent落地进展不及预期;产能供应问题缓解。
目录


1. CPU供给紧张,供应商上调价格

英特尔18A芯片良率提升缓慢,影响CPU出货量。18A工艺引入了新的晶体管设 计和更高效的电力传输方式,但迄今仅交付了一小部分符合英特尔质量标准的芯片。 2025 年夏天的报告显示,18A生产线上出厂的芯片中,只有10%符合英特尔的需求。英 特尔称良率每个月提升 7%-8%,CEO 陈立武表示,“虽然良率提升速度符合内部计划, 但仍低于期望水平。” 据英特尔首席财务官称,良率预计将在 2026 年底达到英特尔期 望的成本水平,2027年将达到行业标准。
服务器CPU预计涨价。Trendforce 预计 2026 年全服务器出货年成长为12.8%,AI服务器出货年增28%以上,因此CPU供需紧张,将推动相关芯片涨价。英特尔投资者 加贝利基金的分析师米卡托·马基诺表示:“到2026 年,服务器CPU的价格上涨幅度至 少达两位数。”同时,Keybanc 数据显示,由于超大规模云服务商大幅采购,英特尔与 AMD在2026全年的服务器CPU产能已基本售罄。为了应对供需极端失衡并确保后续 供应稳定,两家公司均计划将服务器CPU价格上调10-15%。
2. 涨价背后的原因:AI Agent即将爆发
CPU部件紧缺,带动价格上涨。
CPU部件PCB、CCL产能不足。沙利文大中华区执行总监谢书勤表示,AI服务器等领域PCB高多层板的应用及加工材质的转变,使得钻针使用寿命缩短,消耗量暴增,估计在原来的基础上增长了四五倍。高阶CCL采用的树脂体系、玻纤布与铜箔匹配复杂,新进入者良率提升缓慢与客户认证周期长,导致有效产能释放缓慢。叠加上游超薄铜箔与高端玻纤布产能有限,形成阶段性紧缺格局。
PCB、CCL涨价,带动CPU价格上升。因玻纤布等原料供应紧张、价格飙升,日本半导体材料厂Resonac宣布自3月1日起调涨铜箔基板(CCL)、黏合胶片等印刷电路板(PCB)材料售价、涨幅达30%以上。去年底,建滔集团也向客户发涨价函,表示原物料成本已难以吸收,新接单CCL价格全面调涨10%。
Agentic AI对CPU的影响不是线性的,而是乘数级的。
Agentic AI与当前的AI主要区别在于,Agentic AI能够通过自主生成和测试假设来改进系统配置,从而在无需人工干预的情况下实现最佳性能。


Agentic AI工作会大幅提升CPU负载。
Agentic AI远不是“单次推理”,而是动态推理 多步决策 外部工具调用的循环,这比传统大模型调用更耗资源、负载更复杂、成本更高。动态决策结构使得资源消耗与任务长度呈非线性关系增长,即:如果Agent需要更多步骤、更多内部查询/操作,则计算资源(特别是CPU和能耗)会成倍增长。
Agentic AI工作负载很大程度上依赖CPU。智能体框架通常包含决策编排器、工具调用、外部 API、数据库访问等复杂逻辑,这些操作往往在CPU上执行。在多种典型agentic workload(如Toolformer、Langchain、ChemCrow等)中,在CPU上处理工具调用可能占总延迟的84.5%-90.6%。CPU动态能耗在大批量agent处理中可占总能耗的近44%,说明工作负载对CPU的依赖度极高。


沙箱运行带来CPU荷载指数爆发。
Agentic AI运行过程中需要沙箱保护电脑系统。沙箱是一种安全隔离策略和模型,其核心目标是在一个受限的、封闭的环境中运行不受信任的程序或代码。OpenAI、Anthropic、Microsoft等头部大厂均在操作指引文档里提醒用户在运行Agentic AI时需要创建沙箱来保护电脑。如果在运行Agentic AI时不创建沙箱,则可能面临多种风险。
1.基础设施安全失控风险。AI生成的代码存在植入高危系统指令(如删除根目录 rm -rf /*)、恶意系统调用或无限资源耗尽循环的潜在可能。在传统物理服务环境中,此类代码将直接攻击主机操作系统CPU、内存等基础设施,导致数据损失等后果。
2.跨环境执行失配风险。AI生成的代码通常深度耦合特定的运行时库、依赖版本及系统配置。当代码迁移时,将面临底层CPU架、操作系统内核及系统环境的显著差异。这种在本地运行成功但在他处失败的问题是CPU系统执行上下文的不一致性导致,严重阻碍了部署的确定性与可靠性。
3.并发资源干扰与隔离失效风险。在多AI代理(Agent)任务高并发执行的场景下,若运行时隔离机制不彻底,单个任务中的缺陷将通过共享操作系统内核进行资源争夺。这种干扰会劫持其他良性任务乃至关键系统服务的CPU时间片与内存资源,可能引发级联故障,导致整体服务性能雪崩式下降。
Agentic AI中沙箱会显著提升CPU工作量,增加系统时延。有研究对 fork()、execve()、exit() 等系统调用的延迟进行测量,结果显示,在沙箱机制下,系统调用的延迟明显提高(每次syscall增加数微秒开销):fork() 增加约 6.8 µs;execve() 增加约1.2µs;exit()增加约5.9µs。这在大量频繁短生命周期任务(例如agent调用多个工具/脚本)场景下可被放大为显著CPU工作量。另有研究表明函数执行的冷启动延迟在大量并发沙箱启动时会严重拖慢整体性能,说明隔离机制对CPU调度和资源管理存在高开销。DecentJS的proxy-based sandbox在JavaScript基准测试中表现出8×至32×的执行开销,远高于原生执行。

1月12日,DeepSeek联合北京大学发布《Conditional Memory via Scalable Lookup》,推出Engram模块,可以用CPU内存部分替代GPU显存作为运行载体。
在现有的架构中,模型记忆知识的方式是隐式的。当模型需要回答“法国的首都是哪里”时,它无法像人类查阅字典那样直接检索出“巴黎”这个词,而是需要通过多层注意力机制(Attention)和前馈神经网络(FFN)进行复杂的矩阵运算,实际上是在通过计算来模拟检索过程。
这种机制造成了巨大的资源浪费:模型不得不动用宝贵的推理算力去“死记硬背”大量固定的事实性知识(如人名、地名、固定搭配等),这不仅效率低下,还挤占了模型处理复杂逻辑推理的“脑容量”。
针对这一点,DeepSeek提出了“条件记忆”的概念,并设计了实体模块 Engram 来加以实现。Engram 的设计灵感源自自然语言处理(NLP)领域经典的 N-gram(N 元语法)模型,但在深度学习语境下进行了现代化改造。传统的 N-gram 依靠统计词汇共现频率来预测下一个词,而 Engram 则将其转化为一种可学习的、基于哈希(Hash)的向量检索系统。
DeepSeek 在实验中成功演示了将一个高达 1,000 亿参数的 Engram 嵌入表完全存储在廉价的主机内存(CPU DRAM)中,而非昂贵的 GPU 显存里。在模型计算前序层级时,系统通过 PCIe 通道异步地将所需的记忆数据搬运至 GPU。
Engram模块推广后,预计将进一步提升CPU需求。
在英特尔 2025 年第四季度电话会议上,公司财务官表示“正在尽可能将产能转向数据中心以满足强劲需求”,表明在供应受限情况下英特尔优先满足服务器端需求。KeyBanc等机构报告也指出,2026 年服务器CPU产能已基本售罄,公司将部分产能从 PC端调配到服务器CPU以缓解供不应求。AMD在2025–2026年的服务器CPU市场份额快速增长,表明其正在将资源与产线重心从传统消费端向服务器、数据中心倾斜。
4. 投资建议和相关标的
AI Agent落地速度正逐渐加速,其带来的沙箱创建、负载卸载等需求有望大幅拉动CPU的需求。但同时,全球算力供应链产能紧张,多个环节涨价,使得CPU制造成本增加。两方面影响下,我们认为CPU产业有望迎来大周期。
相关标的:
CPU:澜起科技、海光信息、广合科技、龙芯中科、中国长城等。
数据库:星环科技(基于ARM优化,与NV-GPU-GraceCPU适配)。


VIP复盘网