并行科技上线DeepSeek‑V4 百万上下文普惠算力服务全面开放

4月24日，DeepSeek正式发布DeepSeek-V4预览版，在智能体（Agent）能力、世界知识与复杂推理性能上实现开源领域领先突破，标志着国产大模型正式迈入百万上下文普惠时代。

当日，并行科技MaaS平台即完成深度适配与全量部署，DeepSeek-V4预览版全系模型正式上线开放调用，同步支持DeepSeek-V4-Pro高性能旗舰版与DeepSeek-V4-Flash轻量高效版，为企业开发者、科研机构与行业用户提供百万Token超长上下文、高性价比、开箱即用的一站式大模型服务能力，助力国产大模型技术快速落地产业场景。

Pro Flash双版本支持
兼顾性能与性价比

作为并行科技MaaS平台本次重点上线的核心模型，DeepSeek‑V4两大版本各有侧重、优势互补，全面覆盖不同用户的场景需求。

DeepSeek‑V4-Pro 作为高性能旗舰版本，拥有 1.6T 总参数、49B 激活参数与33T 预训练数据，百万 Token 上下文为标配能力。其Agent 能力、数理推理、代码生成与全域知识储备实现全面跃升，在智能编程 Agent 专项评测中稳居开源第一梯队，实测体验优于同类主流模型（如 Sonnet 系列），内容产出质量看齐全球顶尖闭源模型（如 Opus 系列），复杂逻辑推演、精密运算及高阶代码创作能力已比肩全球顶级闭源模型。

DeepSeek‑V4-Flash 则定位轻量高效，配备 284B 总参数、13B 激活参数与32T 预训练数据，同样支持百万 Token 超长上下文。核心推理能力与 Pro 版基本持平，同时依托更小的模型体量与激活规模，具备更低的运行开销、更快的响应速度和更优的成本优势，适用于轻量化办公、标准化 Agent 任务、高并发 API 调用等各类普惠性场景。

架构创新超高上下文效率

DeepSeek‑V4 系列的突破性优势，离不开其架构层面的创新升级。该模型开创了全新的 Token 压缩技术与 DSA 稀疏注意力（DeepSeek Sparse Attention）相结合的注意力机制，搭配流形约束超连接（mHC）与Muon优化器。在百万Token上下文场景下，单 Token推理 FLOPs 仅为前代模型的 27%，KV 缓存占用降至约 10%，显著降低了长文档处理、多轮 Agent 交互、大规模代码工程等场景的算力与显存成本，真正让百万字上下文从“尝鲜体验”变为“普惠标配”。

目前，用户可登录并行智算云官网注册开通，一键调用 DeepSeek‑V4 全系模型。开发者可通过平台 API 文档快速完成集成，支持本地部署与云端调用，新用户更可享受专属算力礼包与技术支持服务。

作为国内领先的算力服务与运营提供商，并行科技依托自主研发的 MaaS 平台，聚合全国超算与智算资源，为用户提供一站式大模型服务、高性能计算、AI 训练与推理等全栈解决方案，配套7×24小时专业运维保障、弹性扩缩容及专属技术支持，可满足金融、法律、研发、政务、教育等多行业的企业级 SLA 要求，适配各类长文本处理与智能协作场景，同时通过标准化按量计费与资源包方案实现分级定价，兼顾高性能场景需求与普惠化应用导向，让更多用户能够便捷、高效地享受前沿大模型技术的核心价值。