华西计算机
本周观点:
海内外大模型用户量及Token消耗量保持快速扩张趋势,国产大模型性价比优势助力全球扩张
海内外大模型用户量及Token消耗量保持快速扩张趋势。根据新浪财经消息,5月28日,公司宣布,Anthropic近期年化营收接近450亿美元。此前,2026年Q1,Anthropic首席执行官Dario Amodei宣布公司实现年化80倍增长。根据火山引擎官方消息,豆包大模型日均Tokens调用量从2024年5月约1200亿提升至2026年6月约180万亿,两年约提升1000倍。
国产大模型性价比优势助力全球扩张。根据新浪财经消息,Google后续可能将token 价格再砍80%。另一方面,微软Microsoft 365 Copilot拟引入国产大模型Deepseek我们认为,两者均表明海外大模型面临的竞争加剧,国内大模型的快速迭代追赶与高性价比是其主要原因之一,国产大模型出海进行全球扩张大势所趋。对比海内外大模型公开报价,可以发现,海内外大模型价格差异明显,但近期伴随国内大模型持续迭代,海内外大模型差距不断缩小,国内大模型性价比逐步凸显。根据openrouter平台最新统计,本周平台调用量最大的大模型前三名为Deepseek V4、MiMo-V2.5和Minimax M3,国产大模型在全球范围内的使用量仍呈现提升态势。
算力供应紧张强化租赁商业模式,Token工厂模式有望成为算力租赁新方向
算力供应紧张强化租赁商业模式。根据AIMultiple GPU Index相关统计,2026年6月B300按月中位租赁价格已接近7.92美元/GPU·小时,B200升至约6.11美元/GPU·小时,较2025年中枢继续抬升;H200最新约4.0美元/GPU·小时,H100大体维持在2.99美元/GPU·小时附近。我们认为,算力租赁价格整体呈现上涨态势,且新一代高端卡价格上行更明显,进一步说明算力的可交付供给仍偏紧。相比传统 AIDC 和算力租赁,Token工厂有望强化算力基础设施环节向下游提升议价能力,并共享产业发展红利。
Token工厂模式有望成为算力租赁新方向。Token工厂是算力基础设施在AI推理需求爆发背景下的新存在方式。NVIDIA将 AI Factory 定义为以 token throughput 衡量产出的专用计算基础设施。Token工厂可以理解为面向大模型推理时代的新型算力基础设施,其核心不再是简单出售机柜、GPU或算力时长,而是持续生产可计量、可定价的智能产出。我们认为,这意味着上游算力基础设施的商业模式正在从“卖容量”转向“卖智能产出效率”。
投资建议
受益标的:Token工厂:协创数据、宏景科技、利通电子、润建股份、软通动力、杰创智能、智微智能、盛视科技、电光科技、赛意信息;
AI大模型及算力基础设施:智谱、Minimax、寒武纪、海光信息、芯原股份、盛科通信、中际旭创、新易盛、胜宏科技、沪电股份、景旺电子、生益科技、江海股份、工业富联
风险提示:市场系统性风险、科技创新政策落地不及预期、中美博弈突发事件。


VIP复盘网