苏姿丰上海开讲：AI正在重新定义计算的每一层

克雷西发自上海
量子位 | 公众号 QbitAI

“AI正在重新定义计算的每一个层次。”

这是AMD AI开发者大会今天首次落地上海时，AMD董事会主席、首席执行官苏姿丰针对AI行业给出的最新判断。

这次应AMD邀请，量子位来到了这场大会现场观摩学习。

参加完这一天的活动后可以感受到，从苏姿丰的判断，到整场大会的选题和阵容，都折射出AI行业正在加速转变。

竞争的焦点，正在从模型能力转向系统工程与全栈优化能力。

photoplus

推理、训练、微调，开发者在每一个环节上面对的挑战，都在变得更加具体、更加工程化。

开发者真正需要的，是一套可以落地、可以优化、可以持续演进的工程体系。

这个判断在中国尤其成立。

DeepSeek、Qwen......过去两年全球最活跃的一批AI工程项目，从未缺少过中国的影子。

中国开发者从来都不只是AI应用的消费者，更是基础设施的建设者。

AMD今天带来的，正是围绕这一趋势的系统性回应。

AI开发者需要新的工程体系

AI落地的成本问题，正在成为整个行业绕不开的核心议题。

图灵奖得主、Google杰出工程师David Patterson在2026年初发出警告，他表示，AI大规模落地，正面临一场成本危机。

这场危机乍看有一个颇具反差的面貌，Token一降再降，但同期的企业AI预算却不降反增。

背后的原因，是AI的工作范式正在发生根本性转变。

OpenClaw、Hermes等Agent框架在几个月内成为开发者社区最热的基础设施，意味着项目从单次问答切换到Agent工作流。

新的工作流下，我们完成一项任务需要多轮规划、多次工具调用、反复验证，每一步都在产生算力消耗。

单次成本降低的情况下，总体成本从账单上的单行数字，变成了系统层面更难看清的累积。

系统层次的问题，自然需要系统性的解决方案，这标志着AI竞争正在进入一个新的阶段。

在这个阶段里，能不能在规模化之下把整套体系跑得稳、跑得省、跑得持续，才是真正的考验。

这种考验可以拆解成三个层次。

首先是成本层面，使用规模越大，Token消耗的累积效应越明显。

一个团队跑十个并发Agent和跑一千个，差异不只是消耗的Token量，整个系统的调度、容错、资源分配都要重新设计，成本结构随之从线性变成指数级。

一个对话框里问一个问题，消耗的是单次调用；但Agent工作流要完成一项任务，背后是多轮规划、多次工具调用、反复验证的完整链路，每一步都在产生算力消耗。

使用规模越大，这种累积效应越明显，成本结构随之从线性变成指数级。

其次，在复杂度层面，工程难度的跃升源于AI应用形态的根本变化。

过去的Chat范式下，一个模型对应一种能力，边界清晰；但Agent时代要求AI“能办事”，一套系统里往往同时跑着多个模型、多种模态、分布式计算和工具调用，任何一个环节的延迟或失败都会影响整个链路。

工程师面对的，是如何维护一套持续演进、随时可能扩展的生产系统。

最后是部署层面，场景碎片化正在成为新的工程负担。

云端推理满足不了所有场景，有些场景要求数据不出本地，有些场景对延迟极度敏感，有些场景根本没有稳定网络。

这些需求把开发者推向了边缘设备和端侧部署，但每换一个硬件平台，工具链、优化策略、调试环境往往都要重来一遍，碎片化带来的隐性成本在悄悄累积。

三层压力叠加，指向同一个结论，开发者真正需要的，是一套可落地、可优化、可持续演进的工程体系。

苏姿丰：中国正在领跑开放生态

这次AI开发者大会上，AMD董事会主席、首席执行官苏姿丰对这套需求给出了AMD的判断：

Agent时代，每个人可以拥有5个、10个甚至100个Agent，算力消耗的结构随之发生根本性变化，单纯堆GPU已经不够，GPU加CPU的完整端到端算力组合才能真正满足需求。

AMD的解决策略，是提供覆盖云端到端侧的全栈算力，以ROCm开源软件平台为核心，让开发者在每一个部署场景里都能找到合适的工具。

这些判断，有更长的来路。

AMD在全球战略层面，面对AI工程化大趋势，有着一套一以贯之的战略。

今年年初的CES 2026上，苏姿丰已经给出了方向：开放生态是AI下一阶段的基础设施。

只有行业围绕开放基础设施和共享标准走到一起，创新才会加速。

基础设施意味着它不属于任何一家公司，它是整个行业共同依赖、共同建设、共同受益的底层。

AMD选择把这个词用在开放生态上，就是在表明一种立场：AI的未来，不应该被锁定在某一套封闭的系统里。

这个立场，也在推动着AMD对自身定位的重塑。

从卖芯片到做平台，AMD的目标是成为开发者可以跨越硬件迭代、长期信赖的软件平台。

软硬件协同与开放生态是实现这一目标的路径。

软件层面的开放让开发者不被硬件代际绑定，硬件层面的持续迭代为软件生态提供更强的底层支撑。

两者互相加持，形成一个庞大开发者群体愿意长期留在其中的体系。

具体到中国市场，AMD深耕大中华区超过30年，上海研发中心是AMD全球最大的研发中心之一。

在苏姿丰看来，中国不只是AMD的重要市场，更是AMD全球路线图的重要组成部分，从芯片到AI软件，再到平台工程，AMD在中国的投入覆盖了完整的技术栈。

同时，在开源生态的判断上，苏姿丰直接点出，中国正在领跑开放生态，这种开放性是推动整个AI生态尽可能快速演进的核心力量，也与AMD的战略方向高度契合。

这次在上海举办大会，正是这套战略在中国市场落地和延续的彰显。

在中国，这套战略落到实处意味着这几件具体的事：

持续投入本地开发者社区建设，让中国开发者在日常工程实践中能真正用起来、用得好；
与本地开源生态协同，免去开发者自己去做适配工作的繁冗；
最终把AI开发与部署的门槛降下来，让更多团队有能力把想法变成跑在生产环境里的系统。

AI开始进入系统化工程实践

AI工程化的竞争，正在变成整个开发者社区需要共同面对的基础建设问题。

这次AMD的AI开发者大会，设置了实战工作坊和技术专题演讲环节，其中的议题分布，就是当下AI工程实践的一个截面。

推理方向的议题，集中在Agent时代带来的新挑战上。

单轮问答的时代，推理成本可以用单次调用的价格来衡量；Agent工作流完成一个任务要经过多轮规划、工具调用和验证，消耗结构完全变了。

如何在新范式下压低Token成本，如何让推理引擎在高并发场景下维持吞吐效率，如何让推理优化本身也能自动化运转，是整个行业正在啃的硬骨头，也是这次推理专题的核心命题。

photoplus

值得注意的是，训练方向的议题，折射出AI应用走向纵深之后的工程压力。

RLHF从研究论文变成各团队的标配流程，怎么在单卡上高效跑通端到端的对齐训练就成了实际问题；

MoE架构开始大规模商用，超大规模训练的稳定性和效率，变成了每天都要面对的工程任务。

端侧方向，则是变化最明显的一块。

完全离线的AI桌面机器人、本地大模型驱动的个人Agent、在本地硬件上跑通完整开发流程的vibe coding......这些场景已经可以在具体的AMD端侧硬件上实现。

端侧AI不再是云端的降级替代，它在隐私保护、低延迟、离线可用等场景下有自己的工程逻辑，需要一套从模型量化到本地推理加速的完整支撑。

photoplus

还有一批议题在开凿更底层的路径。

AI Kernel开发、编译器优化、GPU内核AI智能体、PyTorch分布式训练框架在AMD GPU上的适配......关注的都是决定整个生态能走多远的基础设施层。

AMD正在通过实战工作坊、开源工具链与真实工程场景，强化与开发者社区的长期连接，推动AI开发从模型使用走向系统构建。

从这些议题可以看出，AMD想建立的是让开发者从听懂到做出来、再到持续演进的完整飞轮。

值得一提的是，AMD AI开发者计划-中国也在今天正式上线。

这是AMD面向AI开发者打造的会员生态项目，通过技术资源、开发课程、社区交流和开发者活动等多元支持，帮助开发者更高效地开展AI应用与大模型相关开发。

加入计划的开发者，可以与更广泛的中国开发者社区建立连接，参与由AMD AI专家及生态伙伴支持的技术交流与工作坊。

本次会后，AMD将通过这个计划，持续提供技术内容更新、社区互动、后续开发者活动等资源。

持续加码中国开发者生态建设

开发者生态的建设，是一场长期投入，需要工具链的持续完善、社区的持续运营、本地化适配的持续跟进，以及开发者在一次次真实工程实践中积累起来的信任。

这种信任一旦形成，切换成本极高，因为整个团队的工程惯性、积累的优化经验、调试过的工作流，都已经深度嵌入进来。

显然，这种信任已经被AMD握在了手中。

今天的上海，中国AI工程生态几乎所有关键方向的一线建设者，都被AMD召集在了同一个活动现场。

这种密度是多年积累的结果，也是AMD在中国开发者社区长期耕耘的一个截面。

从DeepSeek、Qwen等中国主流开源模型的第一时间适配，到本地开发者社区的持续建设，AMD在做的事有一条清晰的逻辑：

让中国开发者在日常工程实践中真正用起来、用得好。

这个逻辑背后，是AMD对中国AI市场的一个基本判断：中国不只是AI应用的消费市场，更是AI基础设施的重要建设者。

中国开源社区在训练框架、推理引擎、模型量化等方向上的贡献，正在被全球开发者社区广泛采用。

AMD选择在这个时间节点深度投入中国开发者生态，既是对这一现实的认可，也是对未来的一次押注，他们正在通过开源协同、工具链建设与本地开发者连接，持续加码在中国AI开发者生态中的长期投入。

AI时代最深的护城河，是开发者选择在你的平台上构建，并且不想离开。

AMD在做的事，正是让这件事在中国市场一点一点成为现实。