近日,中国移动即将发布自主研发的九天35B通用大模型,将凭借强大的语言理解、复杂推理与行业场景适配能力,成为央企自研大模型的标杆之作。

作为中国移动“AI能力联合舰队”核心算力伙伴,海光基于旗舰级AI训推一体全功能加速卡深算3号,日前已完成九天35B模型全流程适配与推理验证,依托成熟的DTK软件栈与高性能硬件加速能力,实现高性能、低显存占用的稳定运行,为中移九天大模型规模化落地提供国产化高性能算力底座。
本次适配基于海光自研DTK(DCU Tool Kit)底层软件工具栈与深度优化的vLLM高效推理框架,高度打通九天35B模型推理全链路。海光DCU凭借第三代先进GPGPU架构强劲算力,搭载1.8TB/s高带宽HBM显存,配合混合精度计算能力,在保障模型精度的同时,有效降低显存占用、提升推理吞吐,完美匹配九天 35B 大模型长文本处理、高并发响应的核心需求。依托DAS(DCU AI Software Stack) AI软件栈、CUTLASS开源算子模板库与LightOP融合算子库的全栈优化,海光实现对注意力机制与长序列推理的深度适配,确保模型高效运行。实测显示,在标准推理场景下,深算3号推理延迟与显存占用较同类国产方案显著降低,充分满足通信、政务、金融等行业对大模型低时延、高可靠的部署要求。
中移九天大模型作为中国移动“九天”基座核心产品,具备高安全、高可控、全自主的央企特性,已通过生成式AI服务双备案与A级安全认证,广泛适配数智化转型场景。此次海光快速完成九天35B大模型预适配,不仅体现国产AI算力生态的成熟与响应能力,也构建了“国产DCU 央企大模型”的全栈国产化方案,为中国移动算网融合与AI能力规模化输出提供关键支撑,助力千行百业智能化升级。
作为中国移动深度生态伙伴,海光已深度参与移动云智算中心、万卡级集群建设。未来,海光将持续依托DCU系列产品与DTK全栈技术能力,与中移九天深化协同,共研大模型训练、推理与行业适配优化,加速国产AI算力与央企大模型的深度融合,构建自主可控、高效可靠的新一代AI基础设施。


VIP复盘网