克雷西 发自 上海
量子位 | 公众号 QbitAI
“AI正在重新定义计算的每一个层次。”
这是AMD AI开发者大会今天首次落地上海时,AMD董事会主席、首席执行官苏姿丰针对AI行业给出的最新判断。

这次应AMD邀请,量子位来到了这场大会现场观摩学习。
参加完这一天的活动后可以感受到,从苏姿丰的判断,到整场大会的选题和阵容,都折射出AI行业正在加速转变。
竞争的焦点,正在从模型能力转向系统工程与全栈优化能力。

推理、训练、微调,开发者在每一个环节上面对的挑战,都在变得更加具体、更加工程化。
开发者真正需要的,是一套可以落地、可以优化、可以持续演进的工程体系。
这个判断在中国尤其成立。
DeepSeek、Qwen......过去两年全球最活跃的一批AI工程项目,从未缺少过中国的影子。
中国开发者从来都不只是AI应用的消费者,更是基础设施的建设者。
AMD今天带来的,正是围绕这一趋势的系统性回应。
AI开发者需要新的工程体系
AI落地的成本问题,正在成为整个行业绕不开的核心议题。
图灵奖得主、Google杰出工程师David Patterson在2026年初发出警告,他表示,AI大规模落地,正面临一场成本危机。
这场危机乍看有一个颇具反差的面貌,Token一降再降,但同期的企业AI预算却不降反增。

背后的原因,是AI的工作范式正在发生根本性转变。
OpenClaw、Hermes等Agent框架在几个月内成为开发者社区最热的基础设施,意味着项目从单次问答切换到Agent工作流。
新的工作流下,我们完成一项任务需要多轮规划、多次工具调用、反复验证,每一步都在产生算力消耗。
单次成本降低的情况下,总体成本从账单上的单行数字,变成了系统层面更难看清的累积。
系统层次的问题,自然需要系统性的解决方案,这标志着AI竞争正在进入一个新的阶段。
在这个阶段里,能不能在规模化之下把整套体系跑得稳、跑得省、跑得持续,才是真正的考验。
这种考验可以拆解成三个层次。
首先是成本层面,使用规模越大,Token消耗的累积效应越明显。
一个团队跑十个并发Agent和跑一千个,差异不只是消耗的Token量,整个系统的调度、容错、资源分配都要重新设计,成本结构随之从线性变成指数级。
一个对话框里问一个问题,消耗的是单次调用;但Agent工作流要完成一项任务,背后是多轮规划、多次工具调用、反复验证的完整链路,每一步都在产生算力消耗。
使用规模越大,这种累积效应越明显,成本结构随之从线性变成指数级。
其次,在复杂度层面,工程难度的跃升源于AI应用形态的根本变化。
过去的Chat范式下,一个模型对应一种能力,边界清晰;但Agent时代要求AI“能办事”,一套系统里往往同时跑着多个模型、多种模态、分布式计算和工具调用,任何一个环节的延迟或失败都会影响整个链路。
工程师面对的,是如何维护一套持续演进、随时可能扩展的生产系统。
最后是部署层面,场景碎片化正在成为新的工程负担。
云端推理满足不了所有场景,有些场景要求数据不出本地,有些场景对延迟极度敏感,有些场景根本没有稳定网络。
这些需求把开发者推向了边缘设备和端侧部署,但每换一个硬件平台,工具链、优化策略、调试环境往往都要重来一遍,碎片化带来的隐性成本在悄悄累积。
三层压力叠加,指向同一个结论,开发者真正需要的,是一套可落地、可优化、可持续演进的工程体系。
苏姿丰:中国正在领跑开放生态
这次AI开发者大会上,AMD董事会主席、首席执行官苏姿丰对这套需求给出了AMD的判断:
Agent时代,每个人可以拥有5个、10个甚至100个Agent,算力消耗的结构随之发生根本性变化,单纯堆GPU已经不够,GPU加CPU的完整端到端算力组合才能真正满足需求。
AMD的解决策略,是提供覆盖云端到端侧的全栈算力,以ROCm开源软件平台为核心,让开发者在每一个部署场景里都能找到合适的工具。
这些判断,有更长的来路。
AMD在全球战略层面,面对AI工程化大趋势,有着一套一以贯之的战略。
今年年初的CES 2026上,苏姿丰已经给出了方向:开放生态是AI下一阶段的基础设施。

只有行业围绕开放基础设施和共享标准走到一起,创新才会加速。
基础设施意味着它不属于任何一家公司,它是整个行业共同依赖、共同建设、共同受益的底层。
AMD选择把这个词用在开放生态上,就是在表明一种立场:AI的未来,不应该被锁定在某一套封闭的系统里。
这个立场,也在推动着AMD对自身定位的重塑。

从卖芯片到做平台,AMD的目标是成为开发者可以跨越硬件迭代、长期信赖的软件平台。
软硬件协同与开放生态是实现这一目标的路径。
软件层面的开放让开发者不被硬件代际绑定,硬件层面的持续迭代为软件生态提供更强的底层支撑。
两者互相加持,形成一个庞大开发者群体愿意长期留在其中的体系。
具体到中国市场,AMD深耕大中华区超过30年,上海研发中心是AMD全球最大的研发中心之一。
在苏姿丰看来,中国不只是AMD的重要市场,更是AMD全球路线图的重要组成部分,从芯片到AI软件,再到平台工程,AMD在中国的投入覆盖了完整的技术栈。
同时,在开源生态的判断上,苏姿丰直接点出,中国正在领跑开放生态,这种开放性是推动整个AI生态尽可能快速演进的核心力量,也与AMD的战略方向高度契合。
这次在上海举办大会,正是这套战略在中国市场落地和延续的彰显。
在中国,这套战略落到实处意味着这几件具体的事:
持续投入本地开发者社区建设,让中国开发者在日常工程实践中能真正用起来、用得好;
与本地开源生态协同,免去开发者自己去做适配工作的繁冗;
最终把AI开发与部署的门槛降下来,让更多团队有能力把想法变成跑在生产环境里的系统。
AI开始进入系统化工程实践
AI工程化的竞争,正在变成整个开发者社区需要共同面对的基础建设问题。
这次AMD的AI开发者大会,设置了实战工作坊和技术专题演讲环节,其中的议题分布,就是当下AI工程实践的一个截面。

推理方向的议题,集中在Agent时代带来的新挑战上。
单轮问答的时代,推理成本可以用单次调用的价格来衡量;Agent工作流完成一个任务要经过多轮规划、工具调用和验证,消耗结构完全变了。
如何在新范式下压低Token成本,如何让推理引擎在高并发场景下维持吞吐效率,如何让推理优化本身也能自动化运转,是整个行业正在啃的硬骨头,也是这次推理专题的核心命题。

值得注意的是,训练方向的议题,折射出AI应用走向纵深之后的工程压力。
RLHF从研究论文变成各团队的标配流程,怎么在单卡上高效跑通端到端的对齐训练就成了实际问题;
MoE架构开始大规模商用,超大规模训练的稳定性和效率,变成了每天都要面对的工程任务。
端侧方向,则是变化最明显的一块。
完全离线的AI桌面机器人、本地大模型驱动的个人Agent、在本地硬件上跑通完整开发流程的vibe coding......这些场景已经可以在具体的AMD端侧硬件上实现。
端侧AI不再是云端的降级替代,它在隐私保护、低延迟、离线可用等场景下有自己的工程逻辑,需要一套从模型量化到本地推理加速的完整支撑。

还有一批议题在开凿更底层的路径。
AI Kernel开发、编译器优化、GPU内核AI智能体、PyTorch分布式训练框架在AMD GPU上的适配......关注的都是决定整个生态能走多远的基础设施层。
AMD正在通过实战工作坊、开源工具链与真实工程场景,强化与开发者社区的长期连接,推动AI开发从模型使用走向系统构建。
从这些议题可以看出,AMD想建立的是让开发者从听懂到做出来、再到持续演进的完整飞轮。
值得一提的是,AMD AI开发者计划-中国也在今天正式上线。
这是AMD面向AI开发者打造的会员生态项目,通过技术资源、开发课程、社区交流和开发者活动等多元支持,帮助开发者更高效地开展AI应用与大模型相关开发。
加入计划的开发者,可以与更广泛的中国开发者社区建立连接,参与由AMD AI专家及生态伙伴支持的技术交流与工作坊。
本次会后,AMD将通过这个计划,持续提供技术内容更新、社区互动、后续开发者活动等资源。
持续加码中国开发者生态建设
开发者生态的建设,是一场长期投入,需要工具链的持续完善、社区的持续运营、本地化适配的持续跟进,以及开发者在一次次真实工程实践中积累起来的信任。
这种信任一旦形成,切换成本极高,因为整个团队的工程惯性、积累的优化经验、调试过的工作流,都已经深度嵌入进来。
显然,这种信任已经被AMD握在了手中。
今天的上海,中国AI工程生态几乎所有关键方向的一线建设者,都被AMD召集在了同一个活动现场。

这种密度是多年积累的结果,也是AMD在中国开发者社区长期耕耘的一个截面。
从DeepSeek、Qwen等中国主流开源模型的第一时间适配,到本地开发者社区的持续建设,AMD在做的事有一条清晰的逻辑:
让中国开发者在日常工程实践中真正用起来、用得好。
这个逻辑背后,是AMD对中国AI市场的一个基本判断:中国不只是AI应用的消费市场,更是AI基础设施的重要建设者。
中国开源社区在训练框架、推理引擎、模型量化等方向上的贡献,正在被全球开发者社区广泛采用。
AMD选择在这个时间节点深度投入中国开发者生态,既是对这一现实的认可,也是对未来的一次押注,他们正在通过开源协同、工具链建设与本地开发者连接,持续加码在中国AI开发者生态中的长期投入。
AI时代最深的护城河,是开发者选择在你的平台上构建,并且不想离开。
AMD在做的事,正是让这件事在中国市场一点一点成为现实。


VIP复盘网