3月2日,港股AI龙头公司MiniMax盘后发布了2025年全年业绩公告,系业内首份AI大模型公司财报。
数据显示,MiniMax在2025年实现总收入7903.8万美元,同比增长158.9%,超过70%收入来自国际市场;毛利为2007.9万美元,较去年同期增加437.2%,毛利率提升至25.4%,业绩超市场预期。公司在2026年开年保持了较快的业务拓展节奏,MiniMax M2.5模型与MiniMax Agent产品在全球市场迎来新的增长高峰,M2系列文本模型在2026年2月日均token消耗量已增长至2025年12月的6倍以上。
成绩单的背后,是大模型技术在实际应用中逐渐找到投入与产出的平衡点,这份财报也为市场观察中国大模型行业的商业化进程提供了一个切面。
营收规模扩张,C端与B端齐头并进
根据业绩数据,MiniMax 2025年的收入增长呈现出C端与B端并进的态势。
具体而言,面向C端的AI原生产品收入为5307.5万美元,同比增长143.4%,占总营收比重为67.2%;面向B端的开放平台及其他企业服务收入为2596.3万美元,同比增长197.8%,占比32.8%。
在营收版图上,MiniMax的全球化特征显著。2025年,其国际市场收入占比达到73.0%(约5766.3万美元),累计服务全球超2.36亿名用户及21.4万企业客户和开发者。
值得关注的是,在营收规模扩张的同时,MiniMax的利润结构出现了实质性改善。
2025年,公司毛利额约为2007.9万美元,同比增长437.2%;毛利率由2024年的12.2%提升至25.4%。
与毛利率提升相对应的是公司在费用端的结构性调整。2025年,MiniMax的研发费用为2.5亿美元,同比增长33.8%,增速低于同期营收增速,表明规模效应正在显现;另一方面,营销费用同比下降40.3%至5190万美元。营销费用的下降与营收的增长形成反差,反映出随着模型能力的成熟,MiniMax获客对营销投放的依赖度有所降低,已逐步转向由产品自然增长及口碑驱动的模式。
在上述财务模型的综合影响下,MiniMax 2025年经调整净亏损为2.509亿美元,经调整净亏损率较去年同期出现较大幅收窄。
技术迭代带动推理成本“规模化下降” M2.5霸榜震惊硅谷
毛利率的提升与费用的有效管控,其底层逻辑在于技术迭代带来的成本优化。
财报显示,MiniMax全模态的研发实力强劲,且迭代节奏显著加快。以文本模型为例,从去年6月发布的MiniMax M1,到第四季度的M2、M2.1,再到今年2月发布的M2.5,技术迭代周期已压缩至按月刷新。MiniMax最新自研的原生Agent RL框架Forge,为文本模型带来了约40倍的训练加速。
这种技术势能映射到商业层面,即可体现为推理成本的大幅下探。以最新发布的M2.5模型为例,在SWE-Bench Verified测试中取得80.2%成绩的同时,其经济成本进一步降低——以每秒100 Token的输出速度连续工作一小时只需1美金。换言之,1万美金即可支撑4个AI Agent连续运行一年。
业内人士表示,推理成本降至可规模化部署的水平,将彻底改变企业应用AI的投入产出比。2026年开年,以MiniMax M2.5带动的国产开源大模型调用量首次超过美国,连续霸榜模型调用平台OpenRouter,以高速的吞吐模型服务与极高性价比深刻影响全球的AI创业生态。
此外,模型架构的优化也拓宽了商业化场景。MiniMax M2系列模型采用混合MoE架构,总参数规模达2300亿,但激活参数仅约100亿。较低的激活参数量,使得顶级大模型的私有化部署成为现实,解决了金融、医疗、政务等行业对数据安全的顾虑,打开了原本难以触达的市场空间。
模型能力的提升与成本的下降,有效带动了Token消耗量的增长。数据显示,M2系列文本模型在2026年2月的平均单日Token消耗量已增至2025年12月的6倍以上,其中Coding Plan的Token消耗量增长超过10倍,这也是驱动MiniMax毛利改善的核心业务指标。
继续攀高确立“AI时代平台型公司”战略定位
在技术和商业模式逐步得到验证后,MiniMax对下一阶段的战略方向进行了重新锚定。
“2025年,我们构建了全模态的研发能力,语言、视频、语音、音乐等各主要模态均拥有了具备全球竞争力的模型。同时,不断通过技术创新给全球用户带来更好的体验,升级我们的AI原生产品。全球化布局也走得更深更实。”对于下一步,MiniMax创始人兼首席执行官闫俊杰博士表示:“在公司战略层面,我们会从大模型公司向AI时代的平台型公司迈进,持续定义和推动新的智能范式,以可扩展的基建和token吞吐能力,为全球用户和合作伙伴提供更强大的智能。”
对于2026年的行业发展,MiniMax明确给出了三个维度的预判:
首先,编程领域将开始出现L4至L5级别的智能,从“工具”走向“同事级”协作;其次,办公领域将复刻编程领域的渗透速度,AI智能体在办公场景的交付能力将显著提升;最后,多模态创作将走向“直出可交付”的中长内容,甚至出现更接近流式、实时输出的新形态。
“这三件事叠加,意味着我们将迎来更大规模的智能供给爆发,以及应用层前所未有的创新窗口期。我们所承载的需求,将被放大至全新量级。”闫俊杰强调。


VIP复盘网