网站公告:为了给家人们提供更好的用户体验和服务,股票复盘网V3.0正式上线,新版侧重股市情报和股票资讯,而旧版的复盘工具(连板梯队、热点解读、市场情绪、主线题材、复盘啦、龙虎榜、人气榜等功能)将全部移至VIP复盘网,VIP复盘网是目前市面上最专业的每日涨停复盘工具龙头复盘神器股票复盘工具复盘啦官网复盘盒子股票复盘软件复盘宝,持续上新功能,目前已经上新至V5.9.5版本,请家人们移步至VIP复盘网,另外,每周一、周三、 周日晚上20:00~21:00举办VIP复盘网线上实战课,由具有15年私募基金实战经验,精通龙头、短线、中长线等各种模式,熟悉游资操作的竹炜老师给家人们实战复盘,并讲解操盘技巧,每期只开放100个名额,请家人们快速联系客服报名!!!

扫码报名
返回 当前位置: 首页 财经精选 开源且能力比肩o1!阿里、幻方相继发布重磅新品,推理大模型直逼OpenAI

开源且能力比肩o1!阿里、幻方相继发布重磅新品,推理大模型直逼OpenAI

时间:2024-11-29 13:44
业内推理大模型兴起,为小型AI开发商提供赶超机会,而且推理模型的开发成本低于传统大模型,后进者在构建大模型时可借鉴OpenAI等的研究论文和数据。

在OpenAI发布具有突破性推理能力的模型后,人工智能的推理能力竞赛已然打响,阿里、幻方相继发布重磅新品,不仅性能比肩o1模型而且是开源!

周四,阿里通义千问推出QwQ-32B-Preview开源模型,包含325亿个参数,能够处理最长32000 个 tokens的提示词。在 AIME和MATH基准测试中,表现优于OpenAI推理模型o1-preview和o1-mini。

QwQ是少数能与o1匹敌的模型之一,其在数学和编程领域,尤其在需要深度推理的复杂问题上表现出色,而且它可以用于商业应用。

上周,量化巨头幻方DeepSeek-R1-Lite模型,Preview版在难度较高数学和代码任务上超越o1-preview,大幅领先GPT-4o等。在AIME测试基准中,随着计算时间增加,其得分稳步提升。

值得一提的是,官方还表示,目前模型仍在开发阶段,经持续迭代,正式版DeepSeek-R1模型将完全开源。

阿里、幻方模型崭露头角,预示着业内推理AI正在兴起,这可能为小型AI开发商提供赶超机会,打破目前由少数几家科技巨头主导的局面。

于今年第二季度开始研究推理模型的初创公司Fireworks,其联合创始人兼首席执行官LinQiao表示:

整个开源社区……将会以超快的速度推出推理模型。

此外,科技巨头们也加大了推理模型研发力度,谷歌已将其推理模型团队规模从o1-preview发布前的几十人扩大到200人左右,谷歌还为该团队提供了更多算力资源。 

后进者更具成本优势,思维链成大模型关键

后进者在构建大模型方面更具成本优势。

后进者在开发OpenAI替代品时,似乎受益于斯坦福大学、谷歌、MetaPlatforms和OpenAI自身研究人员近年来发布的关于推理的论文。推理模型的开发成本低于传统的LLMs,如GPT-4o,传统模型需要花费数亿美元在计算资源和训练数据上,并需要合法获取这些数据。

新模型可以帮助OpenAI及其竞争对手开发能够完成困难项目的编码助手。例如,微软和Salesforce等企业软件公司可以利用它们来改进代表客户采取行动的代理,例如安排预约。

值得一提的是,研究人员可以通过让其他模型生成解决问题的思维过程,然后将这些过程用于训练LLM,从而将推理能力融入现有的LLMs中。

一些研究人员还免费向其他开发人员开放了以推理为重点的数据集。例如,阿里巴巴表示,它使用了Open o1其中一个研究小组的数据来构建推理模型。

人工智能初创公司Anyscale和Databricks的联合创始人IonStoica表示:

在开发推理模型方面,OpenAI的竞争对手并没有明显的劣势。

*免责声明:文章内容仅供参考,不构成投资建议

*风险提示:股市有风险,入市需谨慎

股票复盘网
当前版本:V3.0