【国盛计算机】OpenAI发布o3与o4-mini，视觉推理与工具使用突破

OpenAI发布o3和o4-mini，强化学习Scale继续。4月16日，OpenAI 发布了两款突破性的模型：o3和o4-mini ，它们能通过图像进行推理，并可自主调用多种工具。o3是OpenAI 最强大的推理模型，在包括 Codeforces、SWE-bench和MMMU在内的基准测试中设定了新的SOTA。在困难的现实任务中比o1犯的重大错误少20%，尤其是在编程、商业/咨询和创意构思等领域表现出色。o4-mini是一种较小的模型，针对快速、经济高效的推理进行了优化。o3和o4-mini 通常比其前辈 OpenAI o1和 o3-mini更智能、更经济。在o3的开发过程中，OpenAI观察到大规模强化学习呈现出与预训练中相同的“计算量越大，性能越好”的趋势。同时模型的性能也会随着思考时间的增加而持续提升。

o3与o4mini展现强大视觉推理与工具使用能力。1）视觉推理：o3和o4 mini模型首次能够将图像直接整合到它们的思维链中。模型可以动态操作图像，在推理过程中进行旋转、缩放或变换。视觉推理能力还能和 Python 数据分析、网络搜索、图像生成等其他工具协同工作，创造性地、有效地解决更复杂的问题，为用户多模态Agent体验。2）工具使用： o3 和 o4-mini 可以完全访问 ChatGPT 中的工具，并通过 API 中的函数调用访问用户自己的自定义工具。这些模型经过训练，能够推理如何解决问题，选择何时以及如何使用工具，以正确的输出格式在通常不到一分钟快速生成详细而周到的答案。模型能够处理需要访问最新信息的任务，超出模型的内置知识、扩展推理、综合和跨模态的输出生成。OpenAI 还发布了 Codex CLI，一个可以从终端运行的轻量级编码Agent。

MCP影响力扩大，Agent生态构建加速。MCP(模型上下文协议)是一种由Anthropic开源的协议，旨在标准化如何为大模型提供上下文。可以将MCP想象成 AI Agent的 USB-C接口:为大模型提供了一种连接到各种工具和数据源的统一方法。MCP旨在替换碎片化的Agent代码集成，从而使 AI 系统更可靠，更有效。通过建立通用标准，服务商可以基于协议来推出它们自己服务的 AI 能力，从而支持开发者更快的构建更强大的 AI 应用。开发者也不需要重复造轮子，通过开源项目可以建立强大的 AI Agent 生态。 MCP 最早由 Anthropic开源，目前已有越来越多公司和开发人员正在加入 MCP协议，如谷歌、OpenAI、腾讯、阿里。我们认为MCP协议影响力的扩散有助于降低各领域Agent开发难度，加速AI应用落地。

建议关注：

IAAS：寒武纪、海光信息、阿里巴巴、奥飞数据、科华数据、海南华铁、云赛智联、潍柴重机、玉柴国际、弘信电子、协创数据、圣阳股份、润建股份、深信服、神州数码、深桑达、品高股份、金山云、南都电源、云天励飞、优刻得、云从科技、浪潮信息、中科曙光、太极股份、首都在线、杭钢股份、数据港、南兴股份、华策影视、顺网科技、恒为科技、网宿科技、朗科科技等。

垃圾发电：旺能环境、盈峰环境、瀚蓝环境、军信股份等
SAAS：金山办公、用友网络、金蝶国际、泛微网络、鼎捷数智、宇信科技、京北方、致远互联、金桥信息、汉得信息、朗新集团、上海钢联、新致软件、同花顺、萤石网络、润达医疗、中科金财、恒生电子、星环科技、卫宁健康、创业慧康、软通动力、光云科技、科大讯飞、万兴科技、海天信息、创业黑马、迈富时、小商品城、金证股份、顶点软件、朗新集团、晶泰控股、佳发教育、嘉和美康、新大陆、新开普等。

互联网大厂AI链：寒武纪、恒玄科技、孩子王、天键股份、润欣科技、实丰文化、乐鑫科技、萤石网络、中芯国际、润泽科技、欧陆通、华懋科技、浪潮信息、中兴通讯、中科曙光、兆易创新、国光电器、法本信息、亚康股份、申菱环境、兆龙互连等。

军工AI：能科科技、品高股份、普天科技、海格通信等。

脑机接口：诚益通、倍轻松、三博脑科等。

风险提示：AI技术迭代不及预期风险、宏观经济风险、行业竞争加剧风险