云大厂服务能力全面升级,AI落地推广再加速。1)4月9日,阿里云在北京召开AI势能大会,AI和云计算基础设施全面升级。算力上,阿里云第九代ECS开启商业化,算力最高提升20%、价格较上一代再降5%;存储上,文件存储CPFS面向AI智算能力再升级,吞吐、缓存、权限能力均有提升;运维上:跨域网络SLA提升至99.995%,网络智能服务NIS已推出;管控上,“灵骏”可主动发现故障并“自愈”,一个月内的万卡集群有效训练时长占比超93%;推理上,人工智能平台PAI面向MoE架构及推理模型全面升级,首Token生成响应时间降低92%,端到端服务吞吐提升91%,千万级用户活跃用户场景的KV Cache命中率可提升10倍以上;数据上,瑶池数据库产品上新,支持In-DB AI、开箱即用;Agent部署:阿里云百炼上线业界首个全生命周期MCP服务,5分钟即可快速搭建一个专属MCP Agent,同时预告AI Agent Store的愿景。2)4月10日,华为云生态大会2025于安徽芜湖召开。在算力架构上继续创新,推出CloudMatrix 384超节点,高密、高速、高效;同时,继续沉淀行业Know-how,推动盘古大模型的落地;生态亦是华为云的建设重点,开发者规模已超1200万。 Qwen3/Llama4有望四月发布,AI飞轮效应正在显现。1)据彭博社报道阿里计划最早于四月发布其旗舰AI模型的升级版本Qwen 3。Meta此前声称计划在4月29日举办LlamaCon活动,预计Meta会在相应活动中正式推出Llama 4,Llama 4模型将引入逻辑思考体系,同时模型本身还将改善语音输出效果。2)近期业界大模型更新迭代明显加速,3月以来,谷歌Gemini 2.5 Pro、OpenAI GPT-4o、DeepSeek-V3-0324、Qwen2.5-Omni-7B、豆包新版深度思考功能等陆续发布。3)我们认为,产业端各大厂均在不停迭代模型,深度思考以及多模态两方面进展显著,有望打开广阔AI应用空间、带来丰富算力需求。而应用的推广也将加速数据和Know-how的沉淀,叠加单位算力降本,将会进一步推动基座模型性能的优化,AI飞轮效应正在体现。 AI繁荣拉动算力需求,云上游涨价信号已现。1)随着DeepSeek R1、OpenAI o1/o3等深度思考模型陆续推出,推理端对高性能计算的需求快速释放,阿里、腾讯等大厂Capex快速扩张,2024Q4单季度资本开支增幅超250%,云上游正式步入新一轮上行周期。2)各环节来看,云计算、IDC、服务器、GPU、柴油发电机及算力租赁等领域,均在不同程度上出现价格上升的信号,验证云上游景气度,利好产业链各环节龙头厂商。 云平台:以AWS为代表,云计算价格已逐步走高,3月4日H100云计算调用价格相比两周前平均上涨约22%。 IDC:全球智算中心需求激增,北美受电力、散热等因素影响,供给较为紧张,IDC服务费2023年已出现明显上涨,最高服务超60%;国内来看,头部厂商上架率显著提升,核心城市资源较为吃紧,IDC向AIDC换代升级,伴随AI应用需求不断攀升,AI专用数据中心租金亦有望走高。 GPU及服务器:AI算力核心元件,国内供应或日益收紧。DeepSeek热潮带动下,大厂对英伟达H20芯片需求旺盛,8卡机器单价在110万元左右、较年前涨价至少10万。 算力租赁:卡源及资金优势为核心竞争力,2025年3月Coreweave H100服务器租赁价格约为$49/hour,相较2023年4月$38/hour上涨约29%,反映下游的旺盛需求。 柴油发电机:央视财经报道2025年仅国内数据中心用柴油发电机组市场规模就接近100亿元,同比增长超过100%。以1800千瓦的国产高功率柴油发电机组为例,目前市场价格在每台230万元到250万元左右,同比上涨10%-15%。 相关标的: IAAS:阿里巴巴、奥飞数据、科华数据、海南华铁、云赛智联、潍柴重机、玉柴国际、弘信电子、协创数据、圣阳股份、润建股份、深信服、神州数码、深桑达、品高股份、金山云、南都电源、云天励飞、优刻得、云从科技、浪潮信息、中科曙光、太极股份、首都在线、杭钢股份、数据港、南兴股份、华策影视、顺网科技、恒为科技、网宿科技、朗科科技等。 国产算力:寒武纪、海光信息、中科曙光等。 垃圾发电:旺能环境、盈峰环境、瀚蓝环境、军信股份等 SAAS:金山办公、用友网络、金蝶国际、泛微网络、鼎捷数智、宇信科技、京北方、致远互联、金桥信息、汉得信息、朗新集团、上海钢联、新致软件、同花顺、萤石网络、润达医疗、中科金财、恒生电子、星环科技、卫宁健康、创业慧康、软通动力、光云科技、科大讯飞、万兴科技、海天信息、创业黑马、迈富时、小商品城、金证股份、顶点软件、朗新集团、晶泰控股、佳发教育、嘉和美康、新大陆、新开普等。 互联网大厂AI链:寒武纪、恒玄科技、孩子王、天键股份、润欣科技、实丰文化、乐鑫科技、萤石网络、中芯国际、润泽科技、欧陆通、华懋科技、浪潮信息、中兴通讯、中科曙光、兆易创新、国光电器、法本信息、亚康股份、申菱环境、兆龙互连等。 军工AI:能科科技、品高股份、普天科技、海格通信等。 脑机接口:诚益通、倍轻松、三博脑科等。 |
Deepseek引领大模型取得重大突破,以高性能和低成本为AI应用奠基。与此同时,云服务作为AIGC生长的土壤,也正在以惊人的速度迭代。4月上旬,阿里云、华为云等主流平台陆续召开大会,通过打造全栈领先的技术、持续开源开放,为AI应用提速。
1、阿里云:AI和云计算基础设施全面升级
为加速AI应用在企业市场落地,4月9日,阿里云在北京召开AI势能大会。
算力:第九代ECS开启商业化,算力最高提升20%、价格较上一代再降5%。1)基于自研“飞天 CIPU”技术架构,阿里云ECS 9代Intel实例算力较上代提升最高达20%,通过3.6GHz全核睿频与504MB超大L3缓存,可保障高并发场景流畅响应,并结合AMX矩阵加速技术,可显著提升AI数据预处理场景的执行效率。此外,在安全能力上新实例支持TDX机密虚拟机,大大降低了机密计算的使用门槛。2)4月9日,9代Intel企业级实例全面降价,在上一代基础上再降5%,并正式开启商业化售卖,让更多的客户以更划算的价格享受更高性能的云计算服务。
存储:高性能存储优化,训练和推理效率再提升。文件存储CPFS实现了面向AI智算能力的升级。单客户端吞吐性能达40GB/s,单计算节点缓存吞吐15GB/s,支持可线性扩展的分布式缓存。提供容量型存储池,有效降低温冷数据成本,支持高达100GB/s的数据流动。此外,CPFS发布目录级配额,通过Access Point简化数据访问权限管理。

运维:跨域网络SLA提升至99.995%,网络智能服务NIS已推出。1)阿里云ZooRoute技术,把跨域网络SLA提升到99.995%,当前已集成到阿里云跨域,专线和互联网接入网络等场景。2)网络智能服务NIS是阿里云打造的基于AIOps与行业大数据的智能运维工具集,在用户上云的全生命周期提供开箱即用的网络深度可观测能力,包括最新的流量分析NPM、网络架构巡检等。
管控:“灵骏”可主动发现故障并“自愈”,万卡集群有效训练时长占比超93%。从训练到推理,基于GPU的加速计算为AI大模型全面升级。现在,阿里云灵骏智能计算平台可实现智能化感知故障,主动发现故障占比高达96%,并且通过自动化故障处置的“自愈”体系技术,将任务中断恢复时间从小时级压缩至分钟级。在万卡级超大规模训练中,一个月内灵骏GPU集群有效训练时长占比超过93%。
推理:人工智能平台PAI,面向MoE架构及推理模型全面升级。在模型推理阶段,PAI-EAS具备负载感知的PD分离架构,结合MoE分布式推理调度引擎Llumnix,能显著提升推理速度和资源利用率,首Token生成响应时间降低92%,端到端服务吞吐提升91%。同时PAI-EAS推出高性能KV Cache缓存服务,千万级用户活跃用户场景的KV Cache命中率可提升10倍以上。

数据:瑶池数据库产品上新,支持In-DB AI、开箱即用。瑶池数据库核心产品已全面支持In-DB AI功能,通过内嵌“模型即算子”能力,让数据与AI贴得更近,实现用户数据内循环、不出域,显著提升推理效率。云原生数据库PolarDB forAI功能升级,用户通过SQL语句即可调用内置大模型,提供开箱即用的AI能力。
Agent:上线业界首个全生命周期MCP服务,预告Agent Store愿景。1)为了让AI Agent有“更聪明的大脑”、“更丰富的交互”,4月9日,阿里云百炼上线业界首个全生命周期MCP服务,无需用户管理资源、开发部署、工程运维等工作,5分钟即可快速搭建一个专属MCP Agent,大幅降低Agent的开发门槛。百炼平台首批上线了高德、无影、Fetch、Notion等50多款阿里巴巴集团和三方MCP服务,覆盖生活信息、浏览器、信息处理、内容生成等领域。2)阿里云还预告了AI Agent Store的愿景,通过Agent Store这种创新模式,把阿里巴巴集团和生态伙伴的Agent向外开放,让各行各业的人都可以拥有自己专属的助理。


生态:“繁花计划”启动,未来三年目标百万家客户、百亿元商机。在AI势能峰会上,阿里云发布AI生态伙伴计划——“繁花计划”,并推出AI应用与服务市场。未来三年,阿里云将在基础设施,模型,数据,工具,应用,交付六大领域与生态伙伴一起服务百万云上客户,拓展百亿商机。
2、华为云:创新算力架构,全新生态战略
4月10日,华为云生态大会2025于安徽芜湖召开。
创新算力架构,推出CloudMatrix 384超节点。面向AI时代的海量算力需求,华为云基于“一切可池化、一切皆对等、一切可组合”的新型高速互联总线推出CloudMatrix 384超节点,实现从服务器级到矩阵级的资源供给模式转变。CloudMatrix 384具备“高密”“高速”“高效”的特点,通过全面的架构创新,在算力、互联带宽、内存带宽等方面实现全面领先。

沉淀行业Know-how,推动盘古大模型在行业场景落地。1)面向行业多样化场景需求,华为云持续沉淀行业Know-How,盘古大模型已在30多个行业、400多个场景中落地,持续聚焦行业解难题、做难事。2)同时,盘古大模型与华为终端的合作也取得进展,新一代折叠屏旗舰Pura X搭载的全新智慧助手小艺受到用户肯定。
坚定投入生态建设,华为开发者规模超1200万。1)秉持共建、共享、共赢理念,华为云坚定打造云生态体系。目前,华为开发者规模超1200万,伙伴数量超4.5万,云商店应用数量超1.2万。2)本次生态大会期间,科大讯飞、奇瑞汽车、硅基流动、面壁智能等客户伙伴,分享了与华为云的生态合作历程、联合营销和商业落地等情况,展示了华为云生态体系的共建成果。

彭博社4月1日报道,阿里巴巴集团计划最早于本月发布其旗舰AI模型的升级版本Qwen 3。
据IT之家,外媒The Information报道Meta的下一代大语言模型Llama 4仍在开发中,虽然目前Llama 4仍需更多时间优化,不过Meta仍计划在本月晚些时候推出Llama 4。The Information称Meta的Llama 4模型将“借鉴”DeepSeek的机器学习方法,引入逻辑思考体系,同时模型本身还将改善语音输出效果。此前Meta声称计划在4月29日举办LlamaCon活动,旨在帮助开发者利用Llama构建应用和产品,预计Meta 会在相应活动中正式推出Llama 4。
近期业内大模型发布频繁,更新迭代加速:
3月25日,谷歌推出旗下最智能的AI模型Gemini 2.5 Pro的实验版本,它在各种基准测试中都处于领先地位,并在LMArena上以显著优势排名第一。Gemini 2.5模型是思考模型,能够在做出反应之前通过自己的想法进行推理,从而提高性能和准确性。

Gemini 2.5 Pro在一系列需要高级推理的基准测试中都处于领先地位。2.5 Pro不使用会增加成本的测试时间技术(如多数表决),在数学和科学基准测试(如GPQA和AIME 2025)中处于领先地位。
在由数百名学科专家设计的数据集,旨在捕捉人类知识和推理的前沿的“人类的最后考试”中,它在未使用工具的模型中也获得了18.8%的最高分数,这是目前最先进的成绩。
在编码性能上,Gemini 2.5 Pro擅长创建视觉上引人注目的Web应用程序和Agent代码应用程序。在Agent代码评估的行业标准SWE-Bench Verified上,Gemini 2.5 Pro使用自定义Agent设置得分为63.8%。
GPT-4o的原生图像生成迎来大升级。3月25日,OpenAI发布了GPT-4o原生多模态图像生成功能,支持生成更加逼真的图像。
据腾讯科技,GPT-4o图像生成功能具有以下特点:
1)精准渲染图像内文字,能够制作logo、菜单、邀请函和信息图等;
2)精确执行复杂指令,甚至在细节丰富的构图中也能做到;
3)基于先前的图像和文本进行扩展,确保多个交互之间的视觉一致性;
4)支持各种艺术风格,从写实照片到插图等。

3月25日DeepSeek-V3模型更新,各项能力全面进阶,目前版本号DeepSeek-V3-0324,模型能力提升方面包括:
1)推理任务表现提高
新版V3模型借鉴DeepSeek-R1模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过GPT-4.5的得分成绩。
2)前端开发能力增强
在HTML等代码前端任务上,新版V3模型生成的代码可用性更高,视觉效果也更加美观、富有设计感。
3)中文写作升级
在中文写作任务方面,新版V3模型基于R1的写作水平进行了进一步优化,同时特别提升了中长篇文本创作的内容质量。
4)中文搜索能力优化
新版V3模型可以在联网搜索场景下,对于报告生成类指令输出内容更为详实准确、排版更加清晰美观的结果。
3月27日阿里开源通义千问Qwen2.5-Omni-7B。作为通义系列模型中首个端到端全模态大模型,可同时处理文本、图像、音频和视频等多种输入,并实时生成文本与自然语音合成输出。Qwen2.5-Omni在一系列同等规模的单模态模型权威基准测试中,展现出了全球最强的全模态优异性能,其在语音理解、图片理解、视频理解、语音生成等领域的测评分数,均领先于专门的Audio或VL模型,且语音生成测评分数(4.51)达到了与人类持平的能力。在权威的多模态融合任务OmniBench等测评中,Qwen2.5-Omni刷新业界纪录,全维度远超Google的Gemini-1.5-Pro等同类模型。相较于动辄数千亿参数的闭源大模型,Qwen2.5-Omni以7B的小尺寸让全模态大模型在产业上的广泛应用成为可能。即便在手机上,也能轻松部署和应用Qwen2.5-Omni模型。

3月28日豆包新版深度思考功能开启测试,和之前的深度思考不同,新版功能将推理过程的思维链,与搜索深度结合,支持边想边搜,思考过程中,豆包可基于推理多次调用工具、搜索信息,提供更加全面、准确的结果。
我们认为,产业端各大厂都在不停投入模型的研发迭代,尤其在深度思考以及多模态两方面模型持续有新进展,将打开广阔AI应用空间以及带来丰富算力需求。而应用的推广也将加速数据和Know-how的沉淀,叠加算力降本,将会进一步推动基座模型性能的优化,AI飞轮效应正在体现。
OpenAI o1/o3、DeepSeek R1等深度思考模型不断迭代,推理端对高性能计算的需求快速释放,全球云上游市场正经历一轮普遍的价格上涨浪潮。云计算、IDC、服务器、GPU、柴油发动机及算力租赁等领域,均在不同程度上出现价格上升的信号。我们认为,云上游正式步入新一轮上行周期,预示算力基建领域的资本支出及扩容将迎来新机遇,利好产业链各环节龙头厂商。
DeepSeek理论利润率超预期,算力投资ROI已愈加清晰。2025年3月1日,DeepSeek官方发文,首次披露DeepSeek的理论成本和利润率等关键信息。据推算,假定GPU租赁成本2美元/小时,tokens按照R1定价收取,理论利润率高达545%,算力投资ROI愈发清晰。尽管为理论值,但考虑到市场供需波动性,以及目前DeepSeek DAU规模仍处于千万级别,难以全面满足市场需求,未来随着算力需求持续扩张,算力、Tokens带来的盈利效应或将逐步显现。

阿里、腾讯等大厂Capex快速扩张,验证国内AI算力景气度。1)在推理端,随着算力投资ROI提升及大模型能力的不断突破,AI模型性能有望在今年迎来质变,我们看好由推理应用带来的云计算需求持续扩张。2)2025年2月24日,阿里CEO吴泳铭宣布,未来三年阿里将投入超3800亿元用于建设云和AI硬件基础设施;2025年3月19日,腾讯控股公告,2024年第四季AI项目发展所涉及的资本开支390亿元,公司预计在2025年进一步增加Capex,预期Capex占收入的比例为低两位数百分比。云大厂自上而下资本开支指引有望强化市场对于算力投资前景的信心。产业端正展现出积极信号。


云平台:以AWS为代表,云计算价格已逐步走高,H100调用价格两周内涨超20%。DeepSeek R1成本及性能持续优化,打开推理端算力需求,高性能算力价格逐步走高。以AWS为例,3月4日H100云计算调用价格相比两周前平均上涨约22%。

柴油发电机:AI基建加速带火柴油发电机组,供不应求价格上涨。据央视财经3月30日报道,今年以来,随着人工智能技术的快速迭代,全球数据中心建设加速进行,这也带动了核心配套设备柴油发电机组的需求激增,产品出现了供不应求,各个企业正开足马力生产。据测算,2025年,仅国内数据中心用柴油发电机组市场规模就接近100亿元,比2024年增长超过100%。而产品供不应求的同时,也带来了价格的上涨,以1800千瓦的国产高功率柴油发电机组为例,目前市场价格在每台230万元到250万元左右,同比上涨10%-15%。

IDC:北美租金2023年已明显上涨,最高幅度超60%。1)IDC数据中心作为算力基础设施的重要组成部分,随着全球智算中心需求激增,数据中心行业获得显著反发展红利,投融资活动呈现供需两旺态势。IDC数据中心建设投资不断攀升,同时电力、冷却、土地等运营成本也维持上升态势。2)据UBS北美云厂反馈,受电力、散热等因素影响,北美数据中心供给越发紧张,部分数据中心开工前已经被预定,机柜租赁价格也快速增长,由过去单价80美金/kW左右,上涨到120-130美金/kW,涨价幅度最高超60%。

国内核心城市资源吃紧,AI专用数据中心租金或将走高。1)中国智算服务市场2023年已同比增长85.8%,头部IDC服务商受益于新兴的GenAI基础设施的旺盛需求,数据中心上架率稳步上升。以IDC服务商世纪互联为例,根据财报披露,截止24年6月30日,公司基地型机房上架率75.9%,同、环比分别提升63.4%/71.0%。2)根据数智前线统计,2024年的公开招投标市场上,智算中心相关的各类中标项目,始终呈现着阶梯式上升状态,基本每个季度都会向上跳跃一个新台阶,至2024年12月,单月中标项目数已经摸高到至少100个。据IDC中国企业级研究部研究经理杨洋表示,随着IDC向AIDC换代升级,更大规模的算力集群、更高的功率密度、以及由此带来的数据中心改造等增值服务机会将推动IDC市场进入新一轮的高速增长,伴随AI应用需求不断攀升,AI专用数据中心租金也有望走高。

GPU及服务器:AI算力核心元件,国内供应或日益吃紧,H20价格涨幅明显。1)海外来看,以Nvidia的A100/H100为例,A100基于Ampere架构,采用7nm工艺制造,具有6912个CUDA核心,最大可提供312 TFLOPS的AI计算能力;H100采用Hopper架构,配备HBM3e显存,相较于A100其最大显存容量也得以在相同封装尺寸下得到提升,定价相较于上一代产品出现了明显溢价现象。根据第三方价格监测平台显示,2024年8月,电商Amazon渠道上H100价格最高达到最高点44,999美元。2)国内来看,根据财联社报道,DeepSeek热潮带动下,出于性价比、合规性考虑,大厂对英伟达H20芯片需求旺盛,部分经销商表示,H20系价格增幅最大的算力卡,“目前一张8卡的机器,单价110万元左右,较年前至少涨价了10万。”

算力租赁:卡源及资金优势为核心竞争力,租赁价格有望逐步提升。短期来看,自建AI算力需要较大资本投入,且供应端或亦有短缺,对部分厂商而言,算力租赁是一种短期内性价比更高的解决方案。厂商加码算力租赁服务,租赁价格随之上涨。以Nvidia参股的算力租赁公司CoreWeave为例,截至2025年3月,8卡H100服务器租赁价格$49.24/hour,相较于23年4月的$4.76/GPU/hour(即8卡服务器$38.08/hour)价格上涨29.31%。高端算力服务价格呈现上行趋势,反映企业应用端对实时推理算力服务的迫切需求。

IAAS:阿里巴巴、奥飞数据、科华数据、海南华铁、云赛智联、潍柴重机、玉柴国际、弘信电子、协创数据、圣阳股份、润建股份、深信服、神州数码、深桑达、品高股份、金山云、南都电源、云天励飞、优刻得、云从科技、浪潮信息、中科曙光、太极股份、首都在线、杭钢股份、数据港、南兴股份、华策影视、顺网科技、恒为科技、网宿科技、朗科科技等。
国产算力:寒武纪、海光信息、中科曙光等。
垃圾发电:旺能环境、盈峰环境、瀚蓝环境、军信股份等
SAAS:金山办公、用友网络、金蝶国际、泛微网络、鼎捷数智、宇信科技、京北方、致远互联、金桥信息、汉得信息、朗新集团、上海钢联、新致软件、同花顺、萤石网络、润达医疗、中科金财、恒生电子、星环科技、卫宁健康、创业慧康、软通动力、光云科技、科大讯飞、万兴科技、海天信息、创业黑马、迈富时、小商品城、金证股份、顶点软件、朗新集团、晶泰控股、佳发教育、嘉和美康、新大陆、新开普等。
互联网大厂AI链:寒武纪、恒玄科技、孩子王、天键股份、润欣科技、实丰文化、乐鑫科技、萤石网络、中芯国际、润泽科技、欧陆通、华懋科技、浪潮信息、中兴通讯、中科曙光、兆易创新、国光电器、法本信息、亚康股份、申菱环境、兆龙互连等。
军工AI:能科科技、品高股份、普天科技、海格通信等。
脑机接口:诚益通、倍轻松、三博脑科等。
AI技术迭代不及预期风险:若AI技术迭代不及预期,则对产业链相关公司会造成一定不利影响。
宏观经济风险:若宏观经济景气度下行,固定资产投资额放缓,影响企业再投资意愿,从而影响消费者消费意愿和产业链生产意愿,对整个行业将会造成不利影响。
行业竞争加剧风险:若相关企业加快技术迭代和应用布局,整体行业竞争程度加剧,将会对目前行业内企业的增长产生威胁。