大模型进击产业一线，必卷智能体

2024 年被誉为大模型产业落地元年，从年初至今，客户对于大模型的期待不断攀升，期望其解决更多业务场景问题。在这个过程中，**智能体（Agent）正蓬勃发展——越来越多的客户渴望将自身应用演进为下一代智能体。**

简单来说，如果将大模型比作大脑，智能体就像是它的手脚和四肢。它能够拆解客户复杂的需求，调用工作流和工具，化身真正的业务小助手。**智能体门槛相对较低，**使得更多人能够参与其中。**现今大多数 AI 原生应用几乎都能通过智能体搭建。**

目前，业内所有大模型公司和生态企业都在积极布局智能体，这也意味着大模型落地已进入“必卷智能体”的阶段。在 7 月 30 日于上海举办的 2024 京东云峰会上，京东正式发布了言犀智能体平台，这是一个一站式智能体开发平台。京东云认为，**智能体、数字人、具身智能将成为未来大模型与终端用户交互的核心媒介。**其中，智能体更多偏向云端，是企业 AI 原生应用的重要推手。

实际上，京东云此次发布了包含言犀智能体平台在内的、支持大模型落地的全栈产品，旨在加速大模型全场景落地。

**“通用大模型靠算力堆出来，企业大模型则靠业务跑出来。”** 京东技术委员会主席、京东云事业部总裁曹鹏在云峰会上如是说。通过不断完善的产品和工具平台体系，大模型才能与产业深度融合，发挥出最大潜力。

据数智前线了解，京东云大模型全栈产品是在京东供应链这一超级孵化器中孕育而生。目前，在京东内部已有超过 100 个大模型的应用案例，为超过 60 万名员工和 20 万商户提供了有力支持。

01 “一线对智能体的热情令我惊讶”

京东相关负责人表示，在实践中他们深刻体会到，**智能体是今年大模型落地应用效果最显著的工具平台之一。**

京东发布的言犀智能体平台实际上是一个“内生外化”的产品。它从去年 10 月开始研发，今年春季在京东和一些生态链企业开放使用。仅仅几个月时间，**员工就搭建了 3300 多个智能体，**“这让我们惊讶。”该负责人说。同时，平台上也形成了上千个工作流、知识库，受欢迎程度超出预期。

“这可能与京东业务人员众多且链条足够长有关。”一个有趣的现象是，过去几年，京东在核心零售供应链投入了大量的 AI 算法团队。而这次**大模型的变革却为那些过去未被 AI 影响到的群体带来了颠覆性的改变。**一线业务人员、职能部门、产品经理等都结合自身工作创建智能体。

例如，有人开发了**长视频剪辑智能体。**由于京东内部有大量培训视频需要剪辑，过去需要手动找到相应部分，然后使用剪辑软件进行剪辑，一周只能剪辑几个视频。现在，这个视频剪辑助手只要上传视频和需求，就能利用大模型的多模态能力找到对应的帧，员工只需进行剪辑，一周就能完成上百个视频。

**另一个智能小哥助手**为快递小哥提供路径规划和智能提示，解放他们的双手。在京东的智能体市场上，还有大量活跃的智能体。**比如电话营销质检智能体**，已产生百万级访问量，替代人工进行营销电话审核和校验…… 此外，京东拥有超过 60 万名员工，还有大量的通用场景智能体，如报销类、学习类等。

为适应大量一线员工的使用需求，言犀智能体平台**支持零代码开发，**即使没有算法背景的员工也能通过可视化、拖拽方式搭建智能体。**“智能体平台就是为了让每一个 AI 灵感都能快速落地。”**京东相关负责人对此深有感触。

智能体也为组织协作带来了改变。过去，不同业务部门之间协作需要通过拉会的方式，开发流程也需要制定排期。现在，大家自发将各自的工具和 API 注册到智能体平台上，实现了底层能力的链接，其他部门员工可以直接调用，协作效率大大提升。

经过内部磨炼后，言犀智能体平台向外界开放。在商业模式上，**平台提供公有云和私有化部署两种模式。**

市面上已推出的智能体平台，不少侧重于个人开发者，但**言犀智能体平台更侧重于行业。**它在京东内部孵化过程中，得到了京东零售、健康、物流等各个板块的广泛应用，并沉淀了相应的行业解决方案。此次发布中，言犀智能体平台预置了相关的配置模版和插件，以及**100 多种行业解决方案，**客户只需 1 分钟即可构建专属智能体。

**针对企业如何更好地利用智能体，**京东相关负责人建议，尤其要注意以下两方面：**一是要持续挖掘爆款，打造标杆。**例如，京东每周会根据数据，筛选优秀的智能体在官方市场上架，吸引更多人使用。“黑客马拉松则会将其进一步提升到更高的层次，层层递进。”

**另一个方面与平台运营相关。**如何支持成千上万员工的应用？一方面要建立具有企业特色的类目体系，将成千上万的智能体进行分类，方便大家查找; 另一方面要及时沉淀成熟的解决方案，用户可以直接使用。

智能体构建的 AI 原生应用也为企业软件市场带来了变化。一些智能体直接取代了原有的企业 SaaS 软件，另一些则嵌入到 SaaS 系统中。言犀智能体平台还提供了简单的应用发布环节，企业可以将搭建的智能体通过 Web、API 等方式发布到内部 IM，如企业微信和协同办公渠道。

业界观察到，Agent 目前仍处于非常初级的阶段，未来将会产生更多意想不到的 Agent 能力，这离不开成千上万的企业应用者。他们使用的过程将是 AI Agent 进化迭代的过程。

02 智能体背后，大模型的锻造流水线

言犀智能体平台目前已接入数十个大模型。这些模型由言犀 AI 开发计算平台输送而来。在上海云峰会期间，**言犀 AI 开发计算平台全面升级至 2.0，**并根据大模型落地关键点，突出了其中的关键能力。

**第一个能力是模型压缩 + 模型拉升。**从去年年底开始，各家企业的主要精力都集中在根据客户的使用场景，在基础大模型上**裁剪、拉升出各种小模型。**曹鹏介绍，这是因为即使经历了军备竞赛式的投入，通用大模型在实际场景中**“仍然缺少薄薄的一层纸，需要专门调优”。**而且不少场景要求模型反应速度要快，推理成本要低，小模型的市场反而更大。

目前，企业一般采用一个模型群组来实现不同场景的应用。**这些模型群组需要对通用大模型进行萃取压缩，以及灌注企业知识进行放大。**在言犀 AI 开发计算平台上，用户可以通过零代码方式，通过这样的“推和拉”，快速获取一个企业专业模型。同时，推理成本降低 100%，速度提升 1.5 倍。

“目前业界通常分两步走——压缩和垂域模型微调。”京东人工智能业务部相关负责人说，“但**言犀 AI 开发计算平台可以在压缩的过程中将垂域知识灌注进去。**” 这也是京东广泛采纳的一个方案。

**第二个能力是数据准备。**每个行业都有大量的数据，包括多模态数据，这需要工具链具备极强的处理能力。

**同时，过程数据的缺失**是业界落地大模型时遇到的最大障碍。“例如，我们看到一个症状，以及专家的处置建议，但并不知道专家的推理逻辑是什么。”京东健康相关负责人告诉数智前线，“如果没有推理逻辑，就无法解决幻觉问题。”

“我们现在投入了很大精力，通过专家和大模型来补充。” **一种是通过 RAG 的方式，**这是当下业界必不可少的技术，为模型提供文献资料，使其能够自动化地捕捉推理链路; **另一种是通过专家来补充。**工具平台是否能够帮助专家团队提高效率，也是业界技术竞争的关键。

此外，大模型合成数据非常火爆。“如何在垂域合成数据，使其与种子数据更加接近，团队也做了深入研究。”京东人工智能业务部相关负责人说。

**第三个能力是模型评估。**它包括通用能力评估和垂域能力评估。针对通用大模型评测，市场上已经出现了一些不错的榜单，公开了代码和评测数据集，可以进行自动评测，直接给出分数。“要先保证通用能力。如果没有通用能力，就没有垂域。”

至于垂域评测，京东在健康、零售等领域拥有评测数据集，用户在调整完模型后，也可以进行垂域评测。这也是自动化的。当然，也有一些人工评测，比如在健康场景中，人更懂业务，平台也提供类似众包的方式，让大家参与评测。

在产业中，构建一个评测系统至关重要。“与其说如何训练好一个垂域模型，不如说**拥有一个评测体系能告诉你，模型应该往哪个方向改进，这件事尤为重要。**” 除了工具平台之外，京东还组建了评测团队，“他们是我们的幕后英雄”。

03 AI 大底座，加速大模型全场景落地

随着大模型和智能体应用到产业一线，业界发现，计算、网络、存储等底层基础设施也需要适应新局面，解决新挑战。

最典型的一点是，当下产业端的大模型应用实践需要打造更开放的基础设施平台，例如支持**多云、多芯、多活，能够承接多种模型，**从而满足复杂的应用场景和业务需求。

目前，多模态大模型的打造需要比之前多 10 倍甚至 100 倍的算力。全球企业都有一个共同的特点，就是基于异构算力来完成模型的训练、调用和推理，解决普遍面临的算力短缺问题，并提高性价比。

除了计算，在存储方面，模型训练高峰时段可能在数十秒内就要处理 TB 级别的存储数据，而传统应用中，这些海量小文件的处理任务可以分散在几个月的时间跨度里完成。这使得存储产品必须向着更高吞吐量、更高 IOPS、更高带宽和更低延迟的方向进化。“同样的 GPU 算力规模下，存储性能的高低可能带来模型训练周期 3 倍的差异。”曹鹏在演讲中提到。

在 Scaling law 之下，超大规模集群对硬件之间的网络效率提出了新的挑战。不久前，马斯克高调披露已建成 10 万卡 H100 超级算力中心，业界对背后的网络架构——英伟达 Spectrum-X 也格外关注。毕竟，稳定、低延迟的网络关系到集群中的计算资源能否被充分利用。

这些动向都表明，基础设施关系到大模型的落地进程。而在这场系统战面前，厂商们需要构建更强大的 AI 底座，才能加速大模型在全场景落地。

京东云峰会上，披露了京东云 AI 底座的最新演进。例如，在高性能的存储方面，作为京东云自主研发的新一代存储产品云海，历经了 10 余年京东自身复杂场景的磨练，能够提供大模型超大量数据传输所需的极致性能。

峰会上，全面升级至 3.0 版本的京东云云海在吞吐量、带宽、延迟等性能上进一步提升，为大模型全面落地提供了更坚实的支撑。云海也与所有主流国产化平台兼容互认。

据悉，**目前京东云云海在建设银行等重量级金融机构的大模型训练中，提供了底层数据存储的支持。**同时，在上层应用方面，也通过数据要素的合作，帮助这些企业进行线上数字化转型。

在算力方面，京东打造了云舰 AI 算力云平台。它具备对多元异构算力资源的统一管理和调度能力，包括各类 CPU、GPU 和国产化 AI 加速芯片，支持多地域分布式算力的统一调度，提供高性价比的算力供给。

另外，**vGPU 池化方案通过 GPU 异构资源池化，能够将 AI 算力利用率提升 70%，**可有效降低算力成本。行业普遍存在算力焦虑，这也是京东云提供的一种解决方案。

此外，京东云大模型安全可信平台，涵盖超过 200 种特有的红蓝对抗攻击手法，覆盖监管合规要求的全部 31 类风险类型，风险分析准确率高达 95% 以上。

针对大模型企业今年以来的价格战，曹鹏提到，去年京东云峰会就提过要通过技术升级来降低成本，**要全网比价，对标主流云厂商的最低成交价再低 10%。**目前，京东云有超过 100 个产品规格通过比价售卖，并设立了 10 亿比价金，将技术带来的红利回馈给开发者群体。

总而言之，在 2024 京东云峰会上，京东通过发布从基础设施、模型服务到智能体应用的全栈产品，正加速与产业的融合，从而让更多企业的大模型落地，通过业务跑出来。

免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，可联系本站进行审核删除。

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

大模型进击产业一线，必卷智能体

01 “一线对智能体的热情令我惊讶”

02 智能体背后，大模型的锻造流水线

03 AI 大底座，加速大模型全场景落地

相关推荐

发表回复