智谱GLM-5实测逼近Claude Opus 4.5，国产大模型实力再获突破！

继国产大模型Seedance刷屏后，本周AI圈再迎重磅动态。智谱AI新一代旗舰GLM-5正式上线，其内测版本正是此前在海外引爆热议的匿名模型“Pony Alpha”。

该模型在OpenRouter登顶热度榜首，代理式编程单项实测超越Claude Opus位列全球第一；而在官方确认身份前，Pony Alpha已直接驱动相关公司股价连续两日大幅上涨，成为港股AI板块最强催化。

2月12日，Artificial Analysis Intelligence Index v4.0发布。在纳入397个模型、10项专业评测的权威榜单中，GLM-5以50分综合成绩并列全球第三，仅次于GPT-4.6与GPT-5.2、Claude Opus 4.5，成为全球排名最靠前的国产模型之一。

国产大模型首成“系统架构师”

2026年2月11日，智谱AI正式发布新一代旗舰大模型GLM-5，此前以匿名代号“Pony Alpha”在海外OpenRouter平台引爆技术圈，海外热议“最强开源代码模型”“推理深度与工程化能力逼近闭源顶级水准”。

当前硅谷大模型风向已全面转向Agentic Coding，GPT-5.3-Codex、Claude Opus 4.6均聚焦长时程、高复杂度工程任务，如编译内核、重构代码库、批量解决GitHub issue。GLM-5是国内首个跟上这一前沿趋势的模型，实现从“对话式代码生成”到“端到端系统工程”的突破。

实测显示，GLM-5具备顶尖工程能力：构建高并发电商库存系统时，不仅输出精美UI，更自主设计Redis缓存、消息队列、数据库锁，代码可直接上线运行；处理复杂开源项目报错日志时，可规划排查路径、分析依赖树并输出修复补丁，且完全开源。

在专业评测上，GLM-5拿下SWE-bench Verified 77.8分（逼近Opus 4.6的80.9分）、Terminal-Bench 2.0开源第一、Vending Bench 2经营模拟夺冠，Coding与Agent能力达到开源SOTA。

GLM-5采用MoE稀疏架构，擅长长程Agent任务与复杂系统设计，可支撑数百次工具调用、长程记忆与复杂指令执行。

海外开发者评价：“原本以为开源界没人能接住Agentic Coding这一棒，直到我测了GLM-5。”

随着GLM-5正式上线，国产大模型首次在真实工程场景中拥有比肩国际顶尖水平的“系统架构师”，标志着中国在稀疏架构、代码能力与智能体领域正式跻身全球第一梯队，行业竞争重心也从通用能力比拼，转向垂直场景深度落地与工程化能力。

国产算力里程碑：七家芯片同日支持大国模上线

GLM-5 已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等主流国产芯片平台的深度推理适配与算子级优化，能够在国产算力集群上实现高吞吐、低延迟的稳定运行，跑出最强中国方案。

华为昇腾在GLM-5开源发布同时实现 Day0 全流程适配。推理侧，昇腾基于Atlas 800 A3采用W4A8混合精度量化实现744B模型单机高效部署，并通过Lightning Indexer、Sparse Flash Attention等融合算子加速端到端推理，已适配vLLM-Ascend、SGLang等主流引擎。训练侧，针对DSA训练场景，昇腾设计并实现了亲和融合算子，128K长序列下显存减少30G、性能较FA提升8倍。

摩尔线程基于SGLang推理框架，在旗舰级AI训推一体全功能GPU MTT S5000上，Day-0完成了全流程适配与验证。

GLM-5在海光DCU平台上已实现高吞吐、低延迟的稳定推理与训练性能，显著提升国产算力对大模型的承载效率。

此举不仅彰显了智谱AI在国产化适配上的广度与深度，也进一步验证了国产芯片集群对大规模生成式模型的承载能力，成为生态成熟的前夜。

一手实测GLM-5： “聪明程度”已经逼近Claude Opus 4.5

为全面验证GLM-5的真实技术实力，针对模型进行了全场景、高强度、长周期的一手实测，测试覆盖工业级后端开发、长步骤复杂任务规划、多轮次问题调试、数百次工具调用等工程化核心场景，全程对标Claude Opus 4.5的使用体验，最终结果充分印证了GLM-5的开源SOTA实力。

其中，在这次针对《TerraLive·实景地球学习与旅行推荐》的全栈开发实测中，智谱GLM-5彻底颠覆了对AI辅助开发的认知。它不再是一个代码补全工具，而是一位能独立负责从需求分析到产品落地的资深全栈工程师 3D图形工程师交互设计师，展现出了令人惊叹的工程化能力。

输入自然语言提示词后，GLM-5最终交付的《TerraLive》应用，是一个功能完整、体验流畅、视觉精美的3D地球产品。整个过程从一句提示词到可交互的应用，耗时极短，效率提升是传统开发模式的数倍。

智能写作方面，GLM-5可自动拆解复杂分析任务、输出专业垂直报告，并高效提炼信息。

智谱GLM-5用实力证明，国产大模型的全栈开发能力已经站到了全球第一梯队。它能将开发者从繁琐的技术细节中解放出来，让创意和想法以不可思议的速度落地，是真正意义上的“超级生产力引擎”。

体感上，GLM-5的“聪明程度”已经逼近Claude Opus 4.5——但它不再昂贵。海外博主@AICodeKing的实测数据显示，GLM-5在代理编程（Agentic Coding）场景得分589，超越Claude Opus 4.5的585分，位列全球第一；而完成同等编程任务的推理成本仅0.14美元，不足Opus 4.6（6.39美元）的1/40 。

如果说以前是昂贵的Opus当大脑来规划任务、便宜的国产模型做执行，那么现在，GLM-5已经可以独自承担“大脑”的角色，真正实现国产平替。

神秘模型“Pony Alpha”引爆，GLM-5发布前夕智谱市值突破1500亿港元

GLM-5以匿名代号“Pony Alpha”在海外平台率先引爆热度，在官方正式确认身份前，已直接驱动公司股价连续两日大幅上涨，成为港股AI板块最强催化。

2月6日，全球主流模型服务平台OpenRouter悄然上架了一款匿名模型，代号为“Pony Alpha”。

没有任何预热，没有官方宣发。但上线后24小时内，该模型迅速登顶OpenRouter平台热度榜首。

OpenRouter官方推文将Pony Alpha描述为 “前沿基础模型” ，并特别指出其在编程、智能体工作流、推理及角色扮演方面表现强劲，尤其强调其 “极高的工具调用准确率” 。

2月9日，受“匿名顶级模型疑似为智谱GLM-5”消息发酵影响，截至2月11日，其股价连续两日强势领涨，盘中一度飙升，公司总市值一度站上1500亿港元，跻身港股科技股前列。

资金集中押注其在智谱代码能力、智能体（Agent）、通用性能上达到全球第一梯队的技术兑现，验证了市场对国产大模型头部厂商技术迭代与商业化前景的高度认可。

2月11日，智谱官方正式官宣“Pony Alpha=GLM-5”，技术预期落地，本轮由模型技术突破驱动的估值修复，也成为2026年年初港股AI赛道最具标志性的行情。

这是国产大模型首次出现海外技术热度倒逼港股估值的案例。市场交易逻辑已从“跟随者”切换至参数MoE架构、开源SOTA等硬核突破，意味着资本市场对AI公司的定价权，正从财报转向技术预期。