扫码体验VIP
网站公告:为了给家人们提供更好的用户体验和服务,股票复盘网V3.0正式上线,新版侧重股市情报和股票资讯,而旧版的复盘工具(连板梯队、热点解读、市场情绪、主线题材、复盘啦、龙虎榜、人气榜等功能)将全部移至VIP复盘网,VIP复盘网是目前市面上最专业的每日涨停复盘工具龙头复盘神器股票复盘工具复盘啦官网复盘盒子股票复盘软件复盘宝,持续上新功能,目前已经上新至V6.3.5版本,请家人们移步至VIP复盘网 / vip.fupanwang.com

扫码VIP小程序
返回 当前位置: 首页 热点财经 中信建投:GPT-5发布与华为CANN开源有望带动AI应用发展

股市情报:上述文章报告出品方/作者:中信建投证券研究;仅供参考,投资者应独立决策并承担投资风险。

中信建投:GPT-5发布与华为CANN开源有望带动AI应用发展

时间:2025-08-11 07:20
上述文章报告出品方/作者:中信建投证券研究;仅供参考,投资者应独立决策并承担投资风险。

GPT-5正式发布,在长文本记忆、幻觉率的降低和推理效率优化,为AI应用的生长提供了更好的土壤。后续可期待Google、Anthropic的更新和国内模型的跟进,以及基模优化下AI应用代币化的持续落地。华为全面开源CANN生态,针对不同层级开发者差异化开放,大幅提高开发效率,有望对标CUDA加速追赶。1)利好有数据、有客户、有场景的软件企业,AI产品有望带动公司ARPU提升和项目单价上升;2)模型私有化需求增加,利好一体机、超融合和B端服务外包企业;3)市场成交量持续维持高位,互联网金融标的有望受益

GPT-5正式发布,刷新多项能力SOTA202588日凌晨1点,OpenAI正式发布GPT-5,包含GPT-5GPT-5-MiniGPT-5-Nano三个版本。性能方面,GPT-5刷新多项基准测试Sota,尤其在数学、编程、视觉理解和健康领域表现突出,并在大模型竞技场LMArena上各维度取得综合排名第一的成绩。

数学:OpenAI认为使用工具的Benchmark得分不应该与不具备工具访问能力的模型进行比较,而GPT-5AIME 2025 no tools/Python分别得分94.6%/100%,一定程度反映其对工具的有效利用。同时,GPT-5在专家级问题上表现优异,在HMMT(麻省理工学院数学锦标赛)最高获得100%的得分;GPQA Diamond(博士级科学问题)最高得分89.4%HLE(跨学科专家问题)得分42.0%

编程:GPT-5SWE-bench VerifiedWith thinking)得分74.9%,略超Claude Opus 4.174.5%,取得新的Sota。同时,在LMArena 的各类能力得分中,GPT-5WebDev上得分1479分,大幅领先排名第二的Gemini-2.5-Pro1403分)。

多模态:GPT-5在视觉理解方面MMMUWith thinking)得分84.2%(高于gemini 2.5 pro81.7%,但二者在LMArena得分相同,均为1253分且排名第一),在MMMU-ProVideoMMMUBenchmark上较前代模型亦有不同程度的提升。

场景: 教育方面,GPT-5可在几分钟之内生成数百行代码,生成互动内容以解释复杂概念;几分钟时间写出一个法语学习网页,帮用户练发音,且语音语调较前代更加自然;医疗为GPT-5重点应用场景,OpenAI称其为迄今为止最好的健康模型;在涵盖法律、物流、销售和工程等 40 多个职业的具有经济意义的任务上,GPT-547.1%的场景中达到了与专家相当或更高的水平。

GPT-5上下文窗口达400K,可通过实时路由器自行决定适用模型。初基准测试外得分高外,GPT-5还是带实时路由器的统一模型,可以根据用户对话类型、复杂性、工具需求和明确意图快速决定使用哪个模型(类似混合推理模型中自己决定快/慢思考)。同时,GPT-5的上下文窗口提升至400K tokens(约30万字,较o3翻倍),“Memory”功能将新增对Gmail和谷歌日历的访问权限(下周推出,先向专业用户开放,随后是Plus/团队/企业用户),可根据用户偏好帮助用户规划日程。

幻觉率显著降低,成本优化明显。ChatGPT生产环境流量的匿名测试中,GPT-5的事实错误率比4o降低约 45%;启用推理功能时,错误率比o3降低约 80%。在开放性事实准确性基准 LongFactFActScore测试中,GPT-5 thinking的幻觉率比o3减少约六倍;此外,GPT-5进一步降低了模型过于自信的问题,例如在对不存在图像的多模态问题回复欺骗率从o386.7%%降低至9%

而在定价&成本方面,GPT-5全用户可用,Plus用户用量更高,Pro用户可使用带思考能力的GPT-5-ProGPT-5每百万tokens输入$1.25(缓存命中$0.125),输出$10,与Gemini 2.5Pro持平;MiniNano则为GPT-51/51/25。此外,GPT-5在推理效率亦有提升,部分任务表现优于o3,但输出token减少了 50-80%

华为CANN全面开源,加速生态完善。8月5日,在昇腾计算产业发展峰会上,华为轮值董事长徐直军宣布,华为昇腾硬件使能CANN全面开源开放,Mind系列应用使能套件及工具链全面开源,支持用户自主的深度挖潜和自定义开发,加速广大开发者的创新步伐,让昇腾更好用、更易用。

具体而言,CANN(神经网络异构计算架构)是由多种技能栈和算子加速库等组成的软件生态系统,能把上层AI训练框架(如PyTorch、TensorFlow、MindSpore等)和底层昇腾芯片连接起来,使开发者不用关心芯片细节就能调用底层算力,从而加速昇腾生态建设。

针对不同层级开发者差异化开放,大幅提高开发效率。昇腾CANN针对不同技术层级的开发者推出了差异化开放策略。比如在算法创新层,开发者可基于业务场景进行“魔改式”创新;在系统优化层,CANN开放了190多个底层接口,得以释放硬件的原子级能力。在编译生态层,通过开放毕昇编译器的AscendNPU IR接口,开发者可以在接入Triton后直接使用Python语法编写高性能算子,底层硬件差异被完全抽象化。

而在效率方面,CANN通过对计算、内存、通信的优化提高效率。计算层面,昇腾CANN针对MoE大模型训练场景推出了超级算子MLAPO,将MLA前处理耗时从行业平均109ms压缩至45ms,在金融风控模型、广告推荐系统中实现了20%以上的端到端性能提升,打破Transformer架构的算力瓶颈;内存层面,多重地址映射技术可以实现内存碎片的自动化拼接利用,解决动态shape场景的“内存碎片化”难题,让京东商品搜索、腾讯短视频推荐等业务场景的内存利用率提升了20%以上,突破了单卡可承载并发请求量行业极限。在分布式训练领域, NPUDirect通信算法将传统RDMA通信所需的3对同步精简为1次原子操作,让科大讯飞语音大模型的跨机通信时延下降了90%,走通了万卡级分布式训练可行性路径。

根据昇腾官方数据,6年来,有超过60万开发者了解CANN、使用CANN、赋予CANN创新活力,在昇腾CANN持续推进开放,以及产业各方开发者、企业积极参与之下,CANN生态正在快速成长。目前CANN的算子认证开发者已经超过了6000人。随着CANN的进一步开源,昇腾CANN生态有望进一步完善,对标CUDA加速追赶,并为基于国产算力的AI应用开发提供了更好的基础。

总结:GPT-5正式发布,在长文本记忆、幻觉率的降低和推理效率优化,为AI应用的生长提供了更好的土壤。后续可期待GoogleAnthropic的更新和国内模型的跟进,以及基模优化下AI应用代币化的持续落地。华为全面开源CANN生态,针对不同层级开发者差异化开放,大幅提高开发效率,有望对标CUDA加速追赶,同样为国内AI应用开发提供了更好的基础。

海外GPT-5推出,降低幻觉的同时,提升推理性能,降低成本。1)利好有数据、有客户、有场景的软件企业,AI产品有望带动公司ARPU提升和项目单价上升。2)模型私有化需求增加,利好一体机、超融合和B端服务外包企业。

1)宏观经济下行风险:计算机行业下游涉及千行百业,宏观经济下行压力下,行业IT支出不及预期将直接影响计算机行业需求;(2)应收账款坏账风险:计算机多数公司业务以项目制签单为主,需要通过验收后能够收到回款,下游客户付款周期拉长可能导致应收账款坏账增加,并可能进一步导致资产减值损失;(3)行业竞争加剧:计算机行业需求较为确定,但供给端竞争加剧或将导致行业格局发生变化;(4)国际环境变化影响:国际贸易摩擦加剧,美国不断对中国科技施压,对于海外收入占比较高公司可能形成影响

股票复盘网
当前版本:V3.0