人工智能技术的高速发展催生了AI手机、AI PC和AI眼镜等智能设备,并推动其向AI Agent化演进。然而,这些小型终端受限于自身算力,难以充分发挥大型AI模型的能力。因此,构建一套高效的端边云协同解决方案,成为充分利用大模型的关键挑战。
当前,端边云协同已成为大模型技术发展的新趋势,加速了端侧智能应用的落地。近年来,智能门锁、AI看护机、无人机等轻量化端侧AI产品层出不穷,但由于功耗和算力限制,复杂计算任务往往需要转移至边缘或云端进行处理。

在此背景下,字节跳动旗下的火山引擎于2024年冬季FORCE原动力大会上宣布全面升级边缘云服务。此次升级涵盖物联网平台、智能平台和边缘大模型网关服务的优化,并重磅推出边缘原生智能体,旨在构建一套完整的端边云协同基础设施,连接端侧小模型应用和边云大模型能力,从而有效解决端侧算力不足的问题。
火山引擎边缘智能技术负责人介绍,其解决方案采用端边云协同架构:端侧通过OneSDK一站式方案简化嵌入式设备接入大模型流程;边缘侧部署大模型网关,提升调用效率和稳定性;中心侧利用编排智能体简化大模型部署;而边缘原生智能体则支持根据不同行业需求进行个性化定制。
该负责人进一步指出,边缘AI的发展包含基础设施建设和应用场景拓展两个关键方面。基础设施主要解决连接性和计算能力问题,提供大模型的调度和推理能力;而应用场景的发展则面临碎片化和规模化难题。火山引擎的端边云联动智能边缘架构有效解决了这些问题,显著拓展了边缘AI的应用范围。其核心优势在于:一,已获得多家企业(无论大型还是小型)采用,广泛支持AI Agent的部署和应用;二,智能决策器可根据情况动态分配算力,在保证计算效率的同时,确保数据安全和隐私。
AI Agent生态的繁荣发展也印证了这一趋势。数据显示,截至2025年1月4日,AI Agent整体市值已达173.6亿美元,过去一周涨幅近50%。调研报告表明,超过半数受访者已在生产中使用AI Agent,其中中型公司应用最为活跃,主要用于提升生产效率。
火山引擎的边缘智能基础架构不仅优化了端智能接入流程,提升了推理请求速度和安全性,还增强了模型分发和智能体配置等功能。该架构已在润欣科技、地瓜机器人等国内多家企业和单位成功应用,为其业务增长提供了有力支撑。

为了更好地适应AI Agent时代,火山引擎还推出一系列端智能解决方案,包括OneSDK、OneCredential和OneStop,分别提供一站式设备管理、跨云服务权限管理和简化端侧智能体开发部署等功能,降低了使用门槛。
火山引擎的智能决策器基于规则和模型进行动态决策,综合考虑功耗、机型、温度和任务复杂度等因素,将任务智能分配至本地、边缘或云端,并优先保障数据安全和隐私。例如,在智能座舱场景中,隐私对话和行为记录会在本地处理,而复杂操作则由云端大模型处理。

边缘大模型网关具备标准接口、就近访问、推理加速和高鲁棒性等核心能力,支持多家主流大模型厂商和智能体提供商,有效降低延迟并提升访问效率。全球范围的边缘节点和智能流量调度策略进一步优化了整体性能。

边缘原生智能体作为AI模型端侧落地的重要形式,其四大核心能力包括理解设备能力、连接物理世界、单智能体协同和多智能体协同。目前,该技术已应用于智能数字工厂和智慧园区等领域,实现了工业质检和园区安防等功能。

火山引擎边缘云的分布式云网基础设施拥有全球2500多个边缘节点,网络时延控制在1至40毫秒之间,支持端边互联、边边互联和边云互联,实现智能应用的就近上云。此外,针对AI Agent,火山引擎还新增了边缘安全防护功能,包括提示词检测、系统提示词防御和结果检查等,确保数据安全传输。