中信建投：春节大厂模型频发，云需求有望“通胀”

春节期间大模型迎来密集迭代，Google、Anthropic、xAI、阿里巴巴、字节跳动、智谱、MiniMax、Kimi均发布下一代模型，多智能体协同与原生多模态驱动能力跨越式发展。近期亚马逊、谷歌、网宿科技、优刻得等国内外云厂商涨价函频发，AI推理需求拉动行业进入向上拐点，建议关注云涨价逻辑下的核心方向。Agent爆发上游缺货带动CPU与存储量价齐升逻辑持续演绎，底层硬件价值分布从重算力全面转向算存并重。

春节期间大模型迎来密集迭代，多智能体协同与原生多模态驱动能力跨越式发展。在过去的两周内，海内外头部 AI 厂商密集发布新一代基座模型。并行智能体架构、复杂逻辑推理、超长上下文以及原生视音频模态成为本次技术周期的核心特征，产业趋势正快速从对话式问答向复杂工程任务全自动托管演进。

Google：谷歌发布新一代旗舰模型 Gemini 3.1 Pro，在衡量前沿推理能力的 ARC-AGI-2 测试中以 77.1% 的准确率大幅领先竞品，并原生支持百万 Token 超长上下文，MRCR v2 大海捞针测试准确率达 84.9%。在代码与智能体领域，其 LiveCodeBench Pro 积分达 2887 领跑行业。此外，模型在 3D 空间推理与复杂图形生成方面取得突破，仅需文本指令即可快速生成高质量 SVG 动态图形。相比前代，Gemini 3.1 Pro 显著降低了幻觉率，进一步巩固其在复杂逻辑推理与全模态输入领域的头部地位。

Anthropic：作为 Anthropic 最新主力模型，Claude Sonnet 4.6 在代码编写与长文本推理维度实现全面升级。在评估实际知识工作价值的 GDPval-AA 测试中，其表现微幅领先旗舰版 Opus 4.6，成为新一代效率基准。其核心计算机操作能力在 OSWorld 评测中跃升至 72.5%，具备跨网页与本地应用的整合处理能力。在维持每百万输入 3 美元定价不变的基础上，该模型大幅优化了多步任务执行的连贯性，减少了过度工程化情况，加速了端侧智能体应用的商业落地。

xAI：xAI 发布 5000 亿参数 Grok 4.2 测试版，同样加入多智能体集群机制。在处理复杂任务时，系统可自动调度多个异构智能体并行推理与实时交叉验证，综合多维度专业研判后输出结论。该架构在 Alpha Arena 大模型实时投资比赛中表现优异，成为唯一实现正向收益的模型。在前端开发与代码生成场景中，多智能体辩论机制有效规避了单体模型的逻辑陷阱，提升了代码产出的即用性与准确率，验证了并行智能体架构在工程验证环境下的技术优越性。

阿里巴巴：阿里开源 Qwen 3.5 旗舰系列，融合线性注意力与专家混合架构，在维持高水平推理能力的同时，将解码吞吐量提升 8.6 倍。作为原生视觉语言模型，Qwen 3.5 在多模态理解与基准评估中全面对标海外头部产品。其核心技术突破在于后训练阶段对强化学习任务和环境的泛化扩展，使模型通用能力随强化学习环境规模呈线性增长。目前百炼平台已上线 Qwen 3.5-Plus 旗舰接口，提供思考与快速等不同推理模式，并实现对主流编程工具的无缝集成。

字节跳动：字节跳动豆包 2.0 矩阵包含 Pro、Lite、Mini 及专属 Code 版本，针对复杂指令执行进行系统性重构。其中 Pro 版本在深度推理与长链路任务表现突出，于数学及编程竞赛评测中达到金牌水平。多模态层面，豆包 2.0 在流式实时问答和长视频理解中取得行业领先成绩。其 Code 模型深度融合内部 AI 编程工具 TRAE，显著强化了工作流中的自动纠错能力。在保持顶尖模型性能的背景下，豆包 2.0 进一步将 Token 成本降低约一个数量级，有效破解长周期智能体应用落地的成本约束。

智谱：智谱 AI 推出 7440 亿参数的旗舰基座模型 GLM-5，核心能力由辅助编程向自动化智能体工程演进。该模型引入稀疏注意力机制与全新异步强化学习基础设施，大幅降低计算与显存开销。在产业生态方面，GLM-5 首次在华为昇腾算力集群上实现 W4A8 混合精度量化，实测开箱性能对标海外主流算力平台，在长序列与低时延场景下的部署成本降低 50%。GLM-5 的商业化落地，标志着国产大模型在复杂推理能力与底层算力生态适配上取得双重突破。

MiniMax：M2.5 在编程、工具调用等生产力基准测试中刷新行业记录，其 SWE-Bench Verified 准确率达 80.2%。基于自研的原生智能体强化学习框架，M2.5 实现了极高的推理吞吐与极低成本，在 100 TPS 推理速度下，每秒输出 100 Token 连续运行一小时仅需 1 美元。成本与速度的底层突破，使其具备处理数百万 Token 超长上下文任务的经济可行性。目前该模型已在 MiniMax 内部接管约 30% 的真实业务场景，涵盖研发与财务等职能，验证了端侧生产力引擎的产业化潜力。

Kimi：月之暗面发布最新旗舰模型 Kimi K2.5，采用联合文本视觉预训练技术，实现跨模态能力的双向增强。技术层面，K2.5 引入智能体集群与并行智能体强化学习框架，能够将长周期复杂任务拆解为异构子问题并分发处理，使端到端推理延迟降低 4.5 倍。配套发布的编程助手 Kimi Code 已无缝接入主流集成开发环境。凭借高准确率与显著的算力调度效率，Kimi K2.5 迅速登顶开源工具调用榜单，加速了向自动化工程生产力的转化。

从“算力普惠”到“算力通胀”，需求爆发成本传导带动云涨价逻辑持续演绎。近期国内外云厂商涨价函频发，AI推理需求带来的“刚性溢价”拉动行业进入向上拐点。以阿里云为例，我们观察到其增速自24Q2以来持续上涨，25Q3增速更是创下近三年34%的季度新高，其中公共云业务收入增长带动阿里云收入高增，尤其AI相关产品收入连续九个季度实现三位数的同比增长。我们认为，云服务同质化竞争及价格战阶段结束，云资源定价模式从“以价换量”全面转向“溢价变现”。云涨价逻辑下的核心方向：1）边缘云/CDN：AI推理将大规模向边缘侧下沉，针对边缘数据直接计算，减少向中心云数据传输。建议关注CDN涨价带来利润弹性，出海贡献收入增量，卡位边缘AI推理市场；2）云回迁：中心云成本增加，企业选择在本地部署超融合或分布式存储，通过混合云或私有云来降低成本；3）头部云厂商迎来价值重估机遇，持续看好拥有AI云服务定价权的头部CSP。

从“GPU独大”到“异构算力协同”，Agent爆发上游缺货带动CPU与存储量价齐升逻辑持续演绎，底层硬件价值分布从“重算力”全面转向“算存并重”。1）CPU：AI Agent大规模应用同时向边缘及端侧下沉，自主规划、工具调用（API）及复杂逻辑推理高度依赖CPU的通用计算与任务调度能力。伴随Agent普及，非流式处理及串行计算需求激增，驱动CPU用量及规格显著提升；2）内存互连与存算协同（CXL）：高并发推理导致“内存墙”瓶颈凸显，系统级成本增加，数据中心加速部署CXL等高速互连技术以实现内存池化，大幅降低CPU等待时间及算力TCO。

（1）宏观经济下行风险：计算机行业下游涉及千行百业，宏观经济下行压力下，行业IT支出不及预期将直接影响计算机行业需求；（2）应收账款坏账风险：计算机多数公司业务以项目制签单为主，需要通过验收后能够收到回款，下游客户付款周期拉长可能导致应收账款坏账增加，并可能进一步导致资产减值损失；（3）行业竞争加剧：计算机行业需求较为确定，但供给端竞争加剧或将导致行业格局发生变化；（4）国际环境变化影响：国际贸易摩擦加剧，美国不断对中国科技施压，对于海外收入占比较高公司可能形成影响。