【国盛计算机】Agent的下半场，从解决问题到定义问题

Agent的下半场，从解决问题转向定义问题。OpenAI的Agent研究员姚顺雨2025年4月发表文章《The Second Half》，认为AI发展到了下半场，此前训练>评估，之后评估>训练，从解决问题转向定义问题。前半部分专注于建立新的模型和方法，各个领域的基准性能不断提升，但目前已有较好的解决方案，即语言通过Agent的推理进行泛化，其要素包括大规模语言预训练、Scaling数据和计算以及推理和行动的理念。目前即使创建更严格的基准，它们很快也会被解决。因此下半场重点是开发针对现实效用的新型评估或任务。当今Agent发展最关键的两个方向一个是让它拥有自己的奖励，能自己探索；另一个是Multi-Agent，让它们之间能形成组织结构。提升Agent能力方面最重要的是上下文处理能力，或记忆能力，未来一类很有价值的，是能积累用户上下文，或者能构建特殊环境的公司。

自定义Agent是AI应用与算力闭环重要因素。我们认为未来有Agent的形式有三种：用户个人自制的Agent、模型厂商驱动的通用Agent和企业定制的Agent。2025年上半年中国企业级市场大模型的日均总消耗量为10.2万亿Token，较2024年下半年日均调用量暴增363%，其中阿里通义占比17.7%，字节豆包占比14.1%，DeepSeek占比10.3%。大模型在工作中的调用量不仅来自于企业的直接调用，MIT的研究显示AI 已经在改变工作，员工使用个人 ChatGPT 账户、Claude 订阅和其他消费工具来自动化他们工作的大部分内容，MIT调查的公司只有40%表示购买了官方 LLM 订阅，但调查的90%以上的公司员工报告说他们经常使用个人 AI 工具用于工作任务，侧面反映了大模型的使用量有许多是用户已经在用自定义的Agent完成任务，而没有体现在B端直接对大模型的采购。

阿里AI进展不断，国内算力与应用形成初步闭环。9月10日阿里旗下高德地图宣布推出全球首个基于用户行为产生的榜单“高德扫街榜”，构建线下服务信用体系，高德AI模型能识别真实到达行为、现场照片等，剔除无效和虚假评论，同时启动“烟火好店支持计划”，通过发放超10亿元补贴等措施，鼓励用户到店消费，希望每天能为线下餐饮及其他服务业多带去1000万客流。模型方面。模型方面，9月12日阿里发布了下一代基础模型架构 Qwen3-Next，并开源了基于该架构的 Qwen3-Next-80B-A3B 系列模型。设计了全新的模型结构，改进了混合注意力机制、高稀疏度 MoE结构、一系列训练稳定友好的优化，以及提升推理效率的多 token 预测机制。 Qwen3-Next-80B-A3B 在“思考模式”和“非思考模式”下的性能均与规模更大的 Qwen3-235B-A22B-2507 相当，同时在推理速度上显著提升，尤其在长上下文场景中表现更为突出。我们认为阿里已经实现了算力投入-模型创新-应用落地及云服务增长的初步闭环，以阿里为标杆，看好国内其他公司把握AI发展机遇创造更多成就。

建议关注：
算力：寒武纪、海光信息、东阳光、新易盛、胜宏科技、鸿腾精密科技、有方科技、协创数据、中际旭创、沪电股份、东山精密、伟仕佳杰、宏景科技、中芯国际、奥飞数据、云赛智联、科华数据、禾盛新材、潍柴重机、金山云、浙数文化、青云、大位科技、玉柴国际、亿田智能、弘信电子、圣阳股份、润泽科技、润建股份、深信服、神州数码、深桑达、品高股份、云天励飞、优刻得、云从科技、浪潮信息、中科曙光、太极股份、数据港、首都在线。

Agent：阿里巴巴、腾讯控股、拓尔思、阜博集团、快手、美图公司、金蝶国际、金山办公、金桥信息、鼎捷数智、慧辰股份、嘉和美康、海天瑞声、泛微网络、税友股份、朗新集团、壹网壹创、润达医疗、360、万兴科技、用友网络、麦迪科技、宇信科技、京北方、中科金财、致远互联、汉得信息、软通动力、光云科技、上海钢联、新致软件、同花顺、信雅达、萤石网络、迪安诊断、中科金财、恒生电子、星环科技、卫宁健康、创业慧康、科大讯飞、万兴科技、创业黑马、迈富时、小商品城、金证股份、顶点软件、朗新集团、晶泰控股、佳发教育、新大陆、新开普等。

自动驾驶：江淮汽车、赛力斯、小鹏汽车、理想汽车、禾赛、地平线、世运电路等。

军工AI：拓尔思、能科科技、普天科技、品高股份、海格通信、中科星图等。

风险提示：技术迭代不及预期风险；经济下行超预期风险；行业竞争加剧风险