Agent的下半场,从解决问题转向定义问题。OpenAI的Agent研究员姚顺雨2025年4月发表文章《The Second Half》,认为AI发展到了下半场,此前训练>评估,之后评估>训练,从解决问题转向定义问题。前半部分专注于建立新的模型和方法,各个领域的基准性能不断提升,但目前已有较好的解决方案,即语言通过Agent的推理进行泛化,其要素包括大规模语言预训练、Scaling数据和计算以及推理和行动的理念。目前即使创建更严格的基准,它们很快也会被解决。因此下半场重点是开发针对现实效用的新型评估或任务。当今Agent发展最关键的两个方向一个是让它拥有自己的奖励,能自己探索;另一个是Multi-Agent,让它们之间能形成组织结构。提升Agent能力方面最重要的是上下文处理能力,或记忆能力,未来一类很有价值的,是能积累用户上下文,或者能构建特殊环境的公司。
自定义Agent是AI应用与算力闭环重要因素。我们认为未来有Agent的形式有三种:用户个人自制的Agent、模型厂商驱动的通用Agent和企业定制的Agent。2025年上半年中国企业级市场大模型的日均总消耗量为10.2万亿Token,较2024年下半年日均调用量暴增363%,其中阿里通义占比17.7%,字节豆包占比14.1%,DeepSeek占比10.3%。大模型在工作中的调用量不仅来自于企业的直接调用,MIT的研究显示AI 已经在改变工作,员工使用个人 ChatGPT 账户、Claude 订阅和其他消费工具来自动化他们工作的大部分内容,MIT调查的公司只有40%表示购买了官方 LLM 订阅,但调查的90%以上的公司员工报告说他们经常使用个人 AI 工具用于工作任务,侧面反映了大模型的使用量有许多是用户已经在用自定义的Agent完成任务,而没有体现在B端直接对大模型的采购。
阿里AI进展不断,国内算力与应用形成初步闭环。9月10日阿里旗下高德地图宣布推出全球首个基于用户行为产生的榜单“高德扫街榜”,构建线下服务信用体系,高德AI模型能识别真实到达行为、现场照片等,剔除无效和虚假评论,同时启动“烟火好店支持计划”,通过发放超10亿元补贴等措施,鼓励用户到店消费,希望每天能为线下餐饮及其他服务业多带去1000万客流。模型方面。模型方面,9月12日阿里发布了下一代基础模型架构 Qwen3-Next,并开源了基于该架构的 Qwen3-Next-80B-A3B 系列模型。设计了全新的模型结构,改进了混合注意力机制、高稀疏度 MoE结构、一系列训练稳定友好的优化,以及提升推理效率的多 token 预测机制。 Qwen3-Next-80B-A3B 在“思考模式”和“非思考模式”下的性能均与规模更大的 Qwen3-235B-A22B-2507 相当,同时在推理速度上显著提升,尤其在长上下文场景中表现更为突出。我们认为阿里已经实现了算力投入-模型创新-应用落地及云服务增长的初步闭环,以阿里为标杆,看好国内其他公司把握AI发展机遇创造更多成就。
建议关注:
算力:寒武纪、海光信息、东阳光、新易盛、胜宏科技、鸿腾精密科技、有方科技、协创数据、中际旭创、沪电股份、东山精密、伟仕佳杰、宏景科技、中芯国际、奥飞数据、云赛智联、科华数据、禾盛新材、潍柴重机、金山云、浙数文化、青云、大位科技、玉柴国际、亿田智能、弘信电子、圣阳股份、润泽科技、润建股份、深信服、神州数码、深桑达、品高股份、云天励飞、优刻得、云从科技、浪潮信息、中科曙光、太极股份、数据港、首都在线。
Agent:阿里巴巴、腾讯控股、拓尔思、阜博集团、快手、美图公司、金蝶国际、金山办公、金桥信息、鼎捷数智、慧辰股份、嘉和美康、海天瑞声、泛微网络、税友股份、朗新集团、壹网壹创、润达医疗、360、万兴科技、用友网络、麦迪科技、宇信科技、京北方、中科金财、致远互联、汉得信息、软通动力、光云科技、上海钢联、新致软件、同花顺、信雅达、萤石网络、迪安诊断、中科金财、恒生电子、星环科技、卫宁健康、创业慧康、科大讯飞、万兴科技、创业黑马、迈富时、小商品城、金证股份、顶点软件、朗新集团、晶泰控股、佳发教育、新大陆、新开普等。
自动驾驶:江淮汽车、赛力斯、小鹏汽车、理想汽车、禾赛、地平线、世运电路等。
军工AI:拓尔思、能科科技、普天科技、品高股份、海格通信、中科星图等。
风险提示: