【国联民生计算机】聚焦“国模+国芯”：中国“模算协同”伟大机遇

1.本周观点

1.1 大模型“核不扩散条约”持续演进，国模迎来加速发展

海外大模型后门频现，具有重大安全隐患，国内互联网大厂已经开始官宣禁用。据机器之心微信公众号，Claude Code 会在用户不知情的情况下收集本地的代理和时区信息，并通过隐写术（Steganography）的方式，把这些信息隐藏在发往云端的提示词中；这段代码会自动检测用户是否使用中国时区、当前网络代理情况，以及是否连接到某些中国 AI 实验室相关的环境。360 集团创始人周鸿祎近日公开表示“真正可怕的是，一个拥有高权限的AI开发工具在用户不知情的情况下，埋了一套隐藏检测机制，今天它只是检测时区和代理，如果这种隐藏机制继续扩展，明天会不会变成更深层的系统干预？”。因近期Claude Code被曝存在植入后门的安全风险，阿里经综合评估后已将其列入高风险软件名单，自7月10日起阿里将全面禁止内部员工在办公环境下使用Claude Code。

与此同时，中关村自主大模型产业联盟正式发起“网络安全人员开放计划”，测试 GLM-5.2 在网络安全场景中的能力，加强大模型自主可控。本计划面向网络安全企业、安全研究机构、重点实验室、高校安全团队、基础设施安全团队，以及经联盟审核通过的安全研究人员和开源基础设施维护者，受邀、受控开放智谱 GLM- 5.2 系列模型在网络安全场景中的能力。通过本计划，联盟希望帮助可信安全伙伴在合法授权、防御优先、过程可审计的前提下，提升漏洞挖掘、代码审计、补丁验证、安全测试、代码修复和安全研发效率，让先进大模型能力真正服务于网络安全防御体系建设。本计划不面向公众开放，而是面向可信防御者提供受控访问机制。模型能力应优先用于伙伴自身产品、服务、授权系统、开源基础设施和防御性安全研究。智谱将提供模型能力与技术支持；联盟伙伴负责使用场景合规、目标授权、结果复核与漏洞处置，共同构建安全、可信、可治理的大模型网络安全应用机制。

1.2 国模配国芯，国产算力迎发展机遇

根据DeepSeek官方文档介绍，DeepSeek V4将细粒度专家并行(EP)方案同时在英伟达GPU和华为昇腾NPU上完成验证。与非融合的强基线方案相比，该方案在通用推理任务上实现了1.50 ~ 1.73倍的加速；在强化学习（RL）rollout、高速智能体服务等对延迟敏感的场景中，最高加速比可达1.96倍。

同时，根据DeepSeek官方公众号，受限于高端算力，目前V4-Pro模型的服务吞吐仍有限，预计下半年昇腾950超节点批量上市后，Pro价格会大幅下调。因此，V4-Pro模型与国产算力的深度适配，有望成为打造“模算协同”，实现全国产闭环的重要机遇。昇腾超节点系列产品全面支持DeepSeek V4：基于DeepSeek V4-Pro模型，在8K输入场景，昇腾950超节点可实现TPOT约20ms时单卡Decode 吞吐4700TPS。DeepSeek V4-Flash模型，8K长序列输入场景下可实现TPOT约10ms时单卡Decode 吞吐1600TPS。低时延的实现源于昇腾950代际底层架构的三大升级，包括原生精度加速、稀疏访存优化、Vector与Cube共享Memory等。

昇腾超节点方案有望发挥更大价值。昇腾超节点可进一步大幅提升延迟与吞吐，同时实现低成本，并兼顾万卡级别的 Scale out 集群规模，解决了长序列 4K到 1M 序列长度范围内的低延迟、高吞吐需求。该架构支持基于 NAND SSU 的低成本、大容量、高性能 KV Cache，为长序列应用提供有效支撑。其中，昇腾 A3超节点系列产品已实现 DeepSeek V4-Flash 模型单卡 Decode 吞吐 2000 TPS，其代表产品 Atlas 900 A3 SuperPoD 液冷超节点与 Atlas 800 A3 风冷超节点采用平等架构、全局内存统一编址，点对点互联带宽达 784GB/s，提供 32 到 384 多种规格，可满足互联网、运营商、金融等行业对大模型推理超高吞吐、大并发的性能需求。昇腾CANN推出了PyPTO编程范式。PyPTO提供完善的PythonAPI，使开发者能够以符合 Python 习惯的语法进行算子开发。

除昇腾外，以寒武纪为代表的国产厂商也都宣布第一时间完成适配。2026 年4 月 24 日，寒武纪基于 vLLM 推理框架，当日完成深度求索 DeepSeek‑V4‑flash（285B）与 DeepSeek‑V4‑pro（1.6T）两款开源大模型的 Day 0 适配，适配代码已开源至 GitHub。此次成果依托寒武纪自研 NeuWare 软件生态与芯片技术，结合此前对 DeepSeek 系列的软硬件协同优化，实现业界领先算力利用率。适配从两大维度体现核心能力：

第一，快速模型迁移。NeuWare 原生支持主流 AI 框架，联合众智 FlagOS降低适配壁垒，以 Triton 快速开发算子、CNAgent 智能体全流程加速，芯片原生支持低精度格式，实现模型发布即稳定运行。

第二，高性能优化：通过 Torch‑MLU‑Ops 算子库专项加速新模块，BangC优化核心算子；vLLM 支持 5D 混合并行等技术，深度挖掘 MLU 硬件特性，降低通信占比、提升推理吞吐与效率。

DeepSeek 开源模型，推动“算法-芯片协同进化”国产厂商迎来重要发展机遇。DeepSeek 开源推理模型引起产业变革，低成本高效能的模型开源，推动了行业的整体发展。此次 DeepSeek V4 深度融合昇腾等国产算力，并提出“预计下半年昇腾 950 超节点批量上市后，Pro 价格会大幅下调”等观点，实际上侧面验证了国产算力将深度适配模型并有望大规模应用，“模算协同”有望成为国产算力发展的重要机遇。例如，此次 DeepSeek V4 论文《DeepSeek-V4:Towards Highly Efficient Million-Token Context Intelligence》中提出采取 FP4（MXFP4）量化来加速强化学习等环节，而昇腾 950 系列芯片开始已经全系支持 FP4 精度，寒武纪也研究并实践 W4A4 以及 MX-FP8/MX-FP4 等新型数据类型，探索并支持多种高效注意力机制。

1.3 投资建议

AI 科技革命正在驱动新一轮产业增长趋势加速形成。以国产算力、AI 应用为代表的前沿领域，正在从技术探索走向规模化落地，迎来重要的发展机遇期。同时，发展自主大模型与自主算力的紧迫性与战略意义持续凸显，国模加国芯的模算协同、全国产大模型迎来重大战略机遇。建议关注：1）国产大模型产业链：智谱、MiniMax 与宏景科技等配套算力服务商。2）国产算力：寒武纪、海光信息、云天励飞等。3）主权 AI 建设需求利好以浪潮信息为代表的覆盖海外的 AI Infra 厂商。

2.行业新闻

Meta正筹划进军竞争激烈的云计算基础设施市场

Meta正筹划进军竞争激烈的云计算基础设施市场，计划通过出售其过剩的人工智能（AI）计算能力和模型访问权限，将庞大的AI基础设施投资转化为新的创收渠道。据彭博，Meta正在制定一项全新的云业务计划，旨在向外部客户出售计算资源。这一战略举动将开辟出一条全新的竞争赛道，使Meta直接与亚马逊旗下AWS、微软Azure以及谷歌云（Google Cloud）等云计算行业巨头展开角逐。其中一项潜在计划类似于亚马逊AWS的Bedrock服务，即允许外部开发者访问托管在Meta现有AI基础设施上的各类AI模型，包括其自有的Muse Spark模型。

三星公布2nm完整迭代工艺规划

三星电子于7月1日在首尔瑞草总部举办2026三星先进晶圆代工生态论坛（SAFE Forum 2026），三星晶圆代工事业部设计平台开发副总裁申钟信发表演讲，正式确认1.4nm制程（SF1.4）将于2029年实现量产，其改良版SF1.4 计划于2030年量产，重申调整后工艺路线。此前三星曾规划2027年量产1.4nm，2025年量产2nm，但当前时间表已大幅延后。对比来看，三星1.4nm量产节奏晚于台积电（TSM.US）2028年A14工艺，与英特尔（INTC.US）14A工艺（2028年试产、2029年量产）节奏相近。

3.公司新闻

神州数码：7月2日，中国招标投标公共服务平台发布了《国产智算Token工厂项目评标结果公示》，公司下属全资子公司上海神州数码有限公司为该项目中标候选人之一，投标报价为71,700万元。预中标项目的供货产品为神州鲲泰超节点产品，本次预中标是公司在国产AI智算领域的业务突破，助力公司把握AI推理算力规模化增长及算力服务自主可控的产业发展机遇，深化公司在国产智算赛道的战略布局，进一步提升公司在AI算力产品与服务领域的市场竞争力与行业地位。如项目能顺利中标并实施，预计将对公司未来经营业绩产生积极影响。

金山办公：7月1日，公司公告使用自有资金通过集中竞价交易方式进行股份回购，本次回购的股份将全部用于实施员工持股计划、股权激励计划，并将在公司披露股份回购实施结果暨股份变动公告后3年内转让完毕。本次用于回购的资金总额不低于人民币25,000万元（含），不超过人民币50,000万元（含）；按照本次回购金额下限人民币25,000万元、回购价格上限352.11元/股测算，回购数量约为71.00万股，回购股份比例约占公司总股本的0.15%。按照本次回购金额上限人民币50,000万元、回购价格上限352.11元/股测算，回购数量约为142.00万股，回购比例约占公司总股本的0.31%。

科大讯飞：7月1日国家知识产权局信息显示，科大讯飞申请一项名为“一种基于多智能体协同的任务调度方法、设备及计算机程序产品”的专利获得授权公告。专利摘要显示，该申请公开了一种基于多智能体协同的任务调度方法、设备及计算机程序产品，该方法包括：首先在将目标请求任务划分为N个目标子任务后，确定执行每个目标子任务的智能体；然后利用样本请求数据对N个智能体进行强化学习训练，得到由N个智能体组成的训练后的多智能体深度Q网络；并生成利用其执行目标请求任务的目标任务调度策略。接着利用多智能体深度Q网络与改进后的协同进化算法，快速、准确的更新目标任务调度策略，以进一步利用最优的目标任务调度策略，提高对于目标请求任务的调度效率和准确性，从而解决了目前大规模负责任务调度存在的问题，实现了在复杂、动态的任务调度环境中自适应地优化任务调度策略，达到了理想的任务调度效果。

4.本周市场回顾

本周（06.29-07.03）沪深300指数下跌0.54%，中小板指数上涨0.13%，创业板指数下跌4.16%，计算机（中信）板块上涨0.64%。板块个股涨幅前五名分别为：ST银江、中威电子、和仁科技、凯瑞德、*ST航图；跌幅前五名分别为：ST荣科、同有科技、春秋电子、川发龙蟒、熙菱信息。

5.风险提示

1）人工智能政策不及预期：如果在未来一段时间内，人工智能相关政策落地进度缓慢或存在变化，都有可能导致产业发展不及预期。

2）行业竞争加剧：AI领域存在大量竞争者，未来为了在细分领域获取更大份额，可能存在市场、技术等方面竞争持续加剧的情况。