OpenAI发布o3和o4-mini,强化学习Scale继续。4月16日,OpenAI 发布了两款突破性的模型:o3和o4-mini ,它们能通过图像进行推理,并可自主调用多种工具。o3是OpenAI 最强大的推理模型,在包括 Codeforces、SWE-bench和MMMU在内的基准测试中设定了新的SOTA。在困难的现实任务中比o1犯的重大错误少20%,尤其是在编程、商业/咨询和创意构思等领域表现出色。o4-mini是一种较小的模型,针对快速、经济高效的推理进行了优化。o3和o4-mini 通常比其前辈 OpenAI o1和 o3-mini更智能、更经济。在o3的开发过程中,OpenAI观察到大规模强化学习呈现出与预训练中相同的“计算量越大,性能越好”的趋势。同时模型的性能也会随着思考时间的增加而持续提升。
o3与o4mini展现强大视觉推理与工具使用能力。1)视觉推理:o3和o4 mini模型首次能够将图像直接整合到它们的思维链中。模型可以动态操作图像,在推理过程中进行旋转、缩放或变换。视觉推理能力还能和 Python 数据分析、网络搜索、图像生成等其他工具协同工作,创造性地、有效地解决更复杂的问题,为用户多模态Agent体验。2)工具使用: o3 和 o4-mini 可以完全访问 ChatGPT 中的工具,并通过 API 中的函数调用访问用户自己的自定义工具。这些模型经过训练,能够推理如何解决问题,选择何时以及如何使用工具,以正确的输出格式在通常不到一分钟快速生成详细而周到的答案。模型能够处理需要访问最新信息的任务,超出模型的内置知识、扩展推理、综合和跨模态的输出生成。OpenAI 还发布了 Codex CLI,一个可以从终端运行的轻量级编码Agent。
MCP影响力扩大,Agent生态构建加速。MCP(模型上下文协议)是一种由Anthropic开源的协议,旨在标准化如何为大模型提供上下文。可以将MCP想象成 AI Agent的 USB-C接口:为大模型提供了一种连接到各种工具和数据源的统一方法。MCP旨在替换碎片化的Agent代码集成,从而使 AI 系统更可靠,更有效。通过建立通用标准,服务商可以基于协议来推出它们自己服务的 AI 能力,从而支持开发者更快的构建更强大的 AI 应用。开发者也不需要重复造轮子,通过开源项目可以建立强大的 AI Agent 生态。 MCP 最早由 Anthropic开源,目前已有越来越多公司和开发人员正在加入 MCP协议,如谷歌、OpenAI、腾讯、阿里。 我们认为MCP协议影响力的扩散有助于降低各领域Agent开发难度,加速AI应用落地。
建议关注:
IAAS:寒武纪、海光信息、阿里巴巴、奥飞数据、科华数据、海南华铁、云赛智联、潍柴重机、玉柴国际、弘信电子、协创数据、圣阳股份、润建股份、深信服、神州数码、深桑达、品高股份、金山云、南都电源、云天励飞、优刻得、云从科技、浪潮信息、中科曙光、太极股份、首都在线、杭钢股份、数据港、南兴股份、华策影视、顺网科技、恒为科技、网宿科技、朗科科技等。
垃圾发电:旺能环境、盈峰环境、瀚蓝环境、军信股份等
SAAS:金山办公、用友网络、金蝶国际、泛微网络、鼎捷数智、宇信科技、京北方、致远互联、金桥信息、汉得信息、朗新集团、上海钢联、新致软件、同花顺、萤石网络、润达医疗、中科金财、恒生电子、星环科技、卫宁健康、创业慧康、软通动力、光云科技、科大讯飞、万兴科技、海天信息、创业黑马、迈富时、小商品城、金证股份、顶点软件、朗新集团、晶泰控股、佳发教育、嘉和美康、新大陆、新开普等。
互联网大厂AI链:寒武纪、恒玄科技、孩子王、天键股份、润欣科技、实丰文化、乐鑫科技、萤石网络、中芯国际、润泽科技、欧陆通、华懋科技、浪潮信息、中兴通讯、中科曙光、兆易创新、国光电器、法本信息、亚康股份、申菱环境、兆龙互连等。
风险提示:AI技术迭代不及预期风险、宏观经济风险、行业竞争加剧风险