扫码体验VIP
网站公告:为了给家人们提供更好的用户体验和服务,股票复盘网V3.0正式上线,新版侧重股市情报和股票资讯,而旧版的复盘工具(连板梯队、热点解读、市场情绪、主线题材、复盘啦、龙虎榜、人气榜等功能)将全部移至VIP复盘网,VIP复盘网是目前市面上最专业的每日涨停复盘工具龙头复盘神器股票复盘工具复盘啦官网复盘盒子股票复盘软件复盘宝,持续上新功能,目前已经上新至V6.5.7版本,请家人们移步至VIP复盘网 / vip.fupanwang.com

扫码VIP小程序
返回 当前位置: 首页 热点财经 Agent时代,华为云的打法变了

股市情报:上述文章报告出品方/作者:AI大模型工场;仅供参考,投资者应独立决策并承担投资风险。

Agent时代,华为云的打法变了

时间:2026-06-23 17:31
上述文章报告出品方/作者:AI大模型工场;仅供参考,投资者应独立决策并承担投资风险。

华为云INSPIRE创想者大会的讲台上,华为公司董事、华为云CEO周跃峰抛出了让台下观众陷入短暂沉思的观点:“我们不太在乎Token总量是多少。在当前国产化算力确实受限的情况下,我们也不太在乎收入的总量是多少。”


这个表态有些“反常态”,毕竟,在以规模论英雄、以营收定输赢的云计算赛道,没有哪个头部玩家敢公然宣称不在乎收入。


不过,华为云似乎是有另外一种考量。周跃峰强调:“国产化算力生产的Token能否带来健康度和生产力的实质性提升,而不仅仅是情绪价值。”也就是说,不是不拼Token的总量,而是要拼Token的价值。


从大会一口气发布的十余款Agentic AI全栈新品来看,华为云的野心并非小打小闹。Agentic Infra通智一体化基础设施、新一代模型训推平台、企业级智能体平台、行业AI梦工厂四大专区……这几乎覆盖了智能体的每一个底层关节。



Agentic Infra四件套:

华为云的底层答案



几个月前,人们讨论的还是大模型的参数规模、评测榜单和榜单排名。而今,产业话语体系已悄然切换到智能体这个维度。华为云在会上正式提出了Agentic Infra新范式,并发布了构成该范式的“四件套”基础设施产品。


从硅谷到中国,各类Agent应用层出不穷,AI从对话走向执行已成为共识。但一个尴尬的现实是,大多数企业还没准备好。


当Agent从单次对话任务升级为需要自主规划、持续学习、跨系统协作的复杂执行体时,传统的云计算基础设施已出现明显的缺陷,算力调不动、记忆存不住、安全兜不牢等等。


对此,华为云的回应是AICS灵衢智算集群,其核心指标颇为惊艳。基于自研灵衢网络,支持10万卡级集群规模,总算力高达200EFLOPS,Tokens生成时延压缩至10毫秒以内,千卡每秒吞吐达到500万Tokens,在线推理服务可用性高达99.95%。


值得注意的是,华为云不仅在算力规模上做文章,更在效率上下功夫。从底层昇腾芯片到CANN算子库,从灵衢网络到集群架构,华为为Agentic AI构筑的是一条从芯片到集群再到应用的完整通路。


很多智能体在经过多轮对话之后,常常记不住前面几轮的对话内容,或者是之前提过的关键信息。这在聊天场景中只是体验瑕疵,但在企业场景中却是致命的。一个智能体要完成跨天的复杂业务流程,比如客户服务的连续跟进、供应链计划的持续优化,这就要求它必须具备长期记忆和持续学习能力。


华为云推出的AMS Agentic记忆存储解决方案,正是针对这个痛点。它通过NPU直通CMS硬件,打造PB级超大记忆空间,并支持KV Cache分层池化,缓存命中率达到95%,同时大幅降低推理成本。换言之,华为云试图为智能体搭建一套分层记忆系统。短期记忆用于即时任务执行,长期记忆沉淀行业知识和用户偏好。


在许多企业真实的IT环境中,训练任务、推理任务、Agent执行和存储调用往往是“混跑”的。CPU、NPU、网络带宽这些有限的资源,在缺乏智能调度的情况下经常互相抢、互相耗,最终谁也没跑好。


CCE Volcano Next通智一体化调度引擎要解决的就是这个路面拥堵问题。它通过“训推共池 碎片整合”的方式,打通通用计算与智能计算之间的壁垒。凭借FlexNPU技术实现1%的NPU最小切分,推理实例启动缩短至毫秒级。


最后也是最重要的一环,安全。Agent与传统聊天机器人的最大区别在于,它真的会动手调用工具、修改系统、执行操作,如果缺乏有效的安全隔离和权限管控,权限滥用、恶意意图攻击、数据泄漏等风险将如影随形。


AgentSphere提供的正是这样一个安全自治的运行环境。依托内核级沙箱隔离,结合双向网络防护、会话级权限管控及恶意意图防控,它实现了100毫秒级的羽量级沙箱极速启动,每分钟可支持十万级沙箱批量创建。这一能力对于政企客户尤为关键。华为云方面特别强调,其云服务已连续1037天零重大安全事故。


总的来看,华为云此次推出的Agentic Infra四件套,并非简单的算力堆砌或产品迭代,而是在基础设施层面做了一次范式级的系统性重构。周跃峰对此的概括非常精准:“唯有将Token成本、一体化调度、强化学习效率与安全自治做到极致,才能主导Agentic AI时代基础设施的发展主动权。”



不拼Token的总量,

是要拼Token的价值



最近一段时间,中国AI产业上演了一场近乎疯狂的Token价格战。多数企业都在这张牌桌上拼命加注,唯独华为云没有上桌。


华为云选择了一条与互联网云厂商截然不同的道路,它的逻辑不是Token单价的胜负,而是Agent生产力爆发后的长线红利。


互联网云厂商的算力成本,本质上是一道采购到转卖的算术题。它们从英伟达购买GPU,再以一定的溢价卖给客户。GPU涨价,成本就涨;GPU断供,生意就停。这个模式下利润率被上游硬件厂商锁死,竞争只能靠价格战在微薄的毛利空间里肉搏。


而华为云没有这种顾虑。它用的是全国产化算力软硬件,昇腾、鲲鹏、CANN、欧拉,一整套自研体系。周跃峰承认这条路“更曲折,因为华为没有办法用别人的算力,它只能把国产化做成一个产业级答案”。


据IDC统计,2025年中国AI加速卡总出货量约400万张,国产厂商交付165万张,占比41%。其中华为出货81.2万张,占据国产AI加速卡49%的市场份额,仅次于英伟达。


华为把整条产业链的成本控制权握在了自己手里,这不是买别人的卡再卖出去,而是自研芯片再收费。如此一来,华为云的商业模式就能跳出Token单价的囚徒困境。


以CCE Volcano Next通智一体化调度引擎为例,它通过“训推共池 碎片整合”将资源利用率提升了30%以上。AMS记忆存储方案通过KV Cache分层池化,缓存命中率达95%,大幅降低推理成本。ModelArts Next的MaaS模型路由支持成本优先、效果优先、均衡模式三种策略,截至目前,已提供15款SOTA模型服务,模型调度精准率超过95%,调用成本平均降低20%。


另一方面,华为混合云在政府、金融、央国企等国计民生关键行业连续多年市场份额第一,服务全球超过5500家客户。


这类用户的决策逻辑跟互联网创业者完全不同。他们不盯着每百万Token多少钱看,他们看的是数据安全能不能保障合规要求能不能满足、关键业务能不能7×24小时不出事。


在数据主权日益敏感的当下,华为的全栈国产化构成了其他云厂商无法复制的议价权。周跃峰也明确表示,华为云坚持公有云与混合云并重的战略,既保证数据安全,又能实现资源和模型的快速迭代。


而华为云同样也在赌一个判断,赌企业为智能体买单的决策点,终将从每百万Token单价转向完成一个有效商业任务的总成本。


当一个行业的竞争从谁更便宜变成谁更能解决问题时,华为云的“重资产”护城河才刚刚开始显现价值。



不做应用,只做“黑土地”



华为云在本次大会上还正式上线了“行业AI梦工厂”四大专区智慧医疗、具身智能、智能制造、科学计算,本质上也是在打一场数据的圈地运动。


以智慧医疗专区为例。据行业统计,全国3.8万家医院中只有5000家设有病理科,病理医生不足2万人。华为云与上海瑞金医院共同开发的RuiPath病理大模型,已共享给20多家医院,让患者无需到上海即可完成三甲医院专家级别的病理诊断。


具身智能专区的逻辑类似。华为云发布了全球首个全流程具身智能开发平台CloudRobo,提供PB级数据底座及开发管线、云原生具身模型生产引擎,帮助机器人小时级上云,模型分钟级部署。当越来越多的机器人厂商在CloudRobo上开发、训练、部署,机器人的运动轨迹数据、环境   交互数据就会积累在华为云上。


这些行业数据的网络效应,或许比算力的规模效应更有意义。算力可以买,但数据资产买不来。当某个行业的头部玩家都在华为云上跑智能体时,行业内的新玩家为了调用行业知识,也只能选择华为云。


事实上,Agentic Infra四件套、ModelArts Next、智果AgentArts等等这一整套产品矩阵,并不只仅仅是华为云的几款AI产品,这背后更是华为云的野心。它要做的,不是那个被用户每天打开的桌面操作系统,而是那个让所有AI应用、所有模型、所有开发者都离不开的底层基础设施。


华为公司副总裁、华为中国云业务部部长陈林概括:“华为云的战略定位是打造硅基黑土地。


黑土地这个比喻非常有意思,提到黑土地大家多数会想到东北平原的肥沃土地。它不争奇斗艳,但在黑土地里万物皆可扎根且高产丰收。华为云借此在表达其底层底座定位,不直接替客户做行业 AI 应用、不抢占终端业务,只做承载所有 AI 创新的基础设施,如同农民在沃土上种庄稼。


之前百模大战最激烈的时候,几乎所有云厂商都在押注自己的模型,阿里的通义、腾讯的混元、百度的文心。唯独华为云,始终没有把自己的模型作为战略核心。


这次INSPIRE大会上,华为云反而联合智谱、DeepSeek、MiniMax、Kimi、阶跃星辰、百度、讯飞星火等20余家TOP模型厂商,发布了“百模千态,云聚共赢”生态合作计划。


更值得关注的是开源策略,华为云将昇腾CANN、欧拉操作系统、CCE Volcano调度、ModelArts工具链全部开源。企业级智能体平台智果AgentArts公测的同时,开源版openJiuwen同步上线,内核与企业版同源度超90%。


周跃峰在采访中多次强调,华为云要“成为一朵最开放的云”。这和“硅基黑土地”一样,都是说明华为不做应用层的收割者,而是做底层的赋能者。


算力调度、记忆存储、安全执行、模型路由、智能体编排等等这些能力,任何一家企业都不会自己从头建,它们需要一个操作系统级的基础设施供应商。


华为云赌的,就是这个位置。


自研芯片的研发投入、全国产化算力生态的培育、行业数据的积累,这些都是慢工出细活的事。周跃峰在采访中也坦言,“AI 面向行业落地需要更多耐心和投入,这远比做 To C 业务,或者简单通过 APP 问答为个人提供情绪价值要难得多。”


但正因为难,才排挤掉了短期套利者。当全行业都在教智能体如何开得更快时,华为在低头修一条能让车队跑三十年的路。


这条路修在今天,但终点在下一个时代

股票复盘网
当前版本:V3.0