Token昂贵,只因输入质量太差——王晓野在AIGC2026的洞察

当87%的企业高喊“已大规模部署AI”,却只有10%真正从中赚到钱时,这场围绕大模型和Agent的狂欢,其实早该进入更务实的阶段了。

在刚结束的2026中国AIGC产业峰会上,亚马逊云科技产品技术部技术总监王晓野用一组数据戳破了泡沫:Demo容易,生产难。个人在Mac mini上捣鼓一个Agent,跟让几千个Agent在企业分布式环境里稳定、安全、不崩不串,完全是两个世界的工程复杂度。

他直接挑明了企业最常见的误区——别指望一个模型包打天下。从算力成本到数据安全,从记忆管理到全链路可观测性,每一层都是硬骨头。以下整理自他的演讲,希望能给正在踩坑或即将踩坑的团队一些实在的参考。

编辑部 整理自 AIGC2026

Token昂贵,只因输入质量太差——王晓野在AIGC2026的洞察

在他看来,企业养龙虾和个人养龙虾完全是两码事。个人可以随时拔电源重启,但企业级场景里,几千个Agent同时跑在分布式环境中,必须做到自动恢复、权限隔离、数据不泄露——这些才是真正的工程挑战。

这场分享直击了几个关键痛点:

  • 模型选择与响应速度:企业需要灵活切换、性价比优先,而不是绑死在一个模型上。
  • 构建复杂度:分布式系统稳定运行的难度被严重低估。
  • 使用门槛:工程师觉得简单,但业务人员仍然摸不着头脑。
  • 人才缺口:能端到端推动Agent落地的人,少得可怜。

亚马逊云科技CEO Matt Garman有个观点很犀利:过去30年个人生产力从未被真正颠覆,直到Working Agent出现。但走向生产级落地,必须搭建五层能力——算力、模型、数据与知识、Agentic平台、Agent应用。每一层都有坑。

以下为王晓野演讲原文:

大家上午好!非常感谢邀请。

我今天演讲的主题叫《跨越Agent落地鸿沟:从模型到企业级AI Agent落地》

跟前面几位嘉宾分享的方式不太一样,我会直白一些,也会通过一系列产品和案例,跟大家分享我们对企业级Agent落地的思考。

作为一家长期服务全球客户的科技企业,亚马逊云科技一直在通过云服务支持数百万企业客户,今天我也想借由我们产品更新背后的思路,跟大家聊聊:真正把Agent落到企业生产环境时,企业需要回答哪些问题。

Token昂贵,只因输入质量太差——王晓野在AIGC2026的洞察

过去几年,Agent产品和构建框架层出不穷,但真正能在生产环境里大规模、稳定运行的,寥寥无几。这里面的差距在哪?

我们先看大趋势。AI生成音频视频、基础模型、具身智能、Agent——其中Agent离企业落地最近。全民都在养龙虾,但个人环境和企业环境是两件事。

个人配置好后很少需要改动,但企业里几千个Agent安全可信地运行,背后有鸿沟:模型选择、构建复杂度、使用门槛、人才gap。

三个礼拜前,亚马逊云科技CEO Matt Garman说,AI和Agent带来了市场构建范式变化,应用应该被重新改造。他还说,过去30年个人生产力从未被真正大规模颠覆过,但今天Agent的出现让工作方式开始变化。

Gartner预测,2028-2030年超过15%的企业日常工作决策由Agent自主完成。麦肯锡称Agent带来的增量市场规模可能从2.6万亿美元涨到4.4万亿美元。但现实是,87%的企业部署了AI,只有10%真正获得生产价值。

Token昂贵,只因输入质量太差——王晓野在AIGC2026的洞察

龙虾让我们看到了河对岸,但企业需要一座桥。亚马逊云科技认为需要关注五大能力:

第一层是AI Agent所需的算力。推理算力比训练更重要,性价比还没到可以随意使用的程度。亚马逊云科技自研芯片,从Graviton到Trainium,为不同负载提供最优性价比。

第二层是模型。企业需要选择,而不是被绑定。Amazon Bedrock支持智谱、MiniMax等模型,同时提供企业数据保护和隐私。

第三层是数据和知识。传统数据平台服务人,现在必须服务AI Agent。Agent对数据的调用方式不同——一次任务可能带来无数次调用。需要AI-ready的数据平台,解决记忆共享与隔离、生命周期管理、Token使用效率问题。Token贵往往是因为喂给模型太多无用信息。

第四层是Agentic平台。模型之外的Harness才是关键。Amazon Bedrock AgentCore提供Runtime、Memory、Code Interpreter、Browser等能力,以及Identity、Gateway、Policy、Evaluation、Observability等管控。

Token昂贵,只因输入质量太差——王晓野在AIGC2026的洞察

前一阵我们与OpenAI联合发布Managed Agent,把OpenAI的前沿模型和最佳实践Harness,结合亚马逊云科技的安全基础设施打包。企业可以同时选择Bedrock AgentCore的开放灵活和Managed Agent的便捷。

第五层是Agent应用。Coding Agent已成熟,Working Agent即将爆发。但员工希望Agent什么都做,企业希望管控。亚马逊云科技的Quick产品实现了深度个性化,像日常小助手一样主动提醒、执行任务、沉淀个人知识图谱。

最后简单总结:我们通过五层能力,希望让更好的模型,通过可信的数据,真正把生产级平台带给用户。Matt Garman说每一个应用都将被重构,领先企业已经走在路上。我们也将持续迭代产品,加速重构,拥抱Agent时代。

谢谢大家。

客观来看,这场演讲真正有价值的地方在于戳破了“模型崇拜”:企业落地的瓶颈从来不在模型本身,而在于如何把模型嵌入到现有的IT系统、数据流和权限体系中。Token成本高,很多时候是因为企业把几千个技能一股脑塞给模型,让它在垃圾堆里找黄金。记忆管理、生命周期、可观测性——这些听起来不那么性感的工程细节,才是决定Agent能否从Demo走向生产的关键。未来一年,能解决这些“脏活累活”的平台,才会真正拿到企业市场的门票。

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行审核删除。
(0)
Rain科技Rain科技
上一篇 12小时前
下一篇 11小时前

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

欢迎来到AI快讯网,开启AI资讯新时代!