亚马逊近日正式发布了其通用人工智能 (AGI) 智能体 Nova Act,标志着该公司在 AI 领域迈出了重要一步。Nova Act 具备操控网络浏览器的能力,并能自主执行简单的在线任务,旨在为用户提供更为智能化和便捷的网络体验。这项技术的发布,预示着 AI 在人机交互方面应用场景的进一步拓展。
为了支持开发者探索和构建基于 Nova Act 的智能体应用原型,亚马逊同步推出了相应的软件开发工具包 (SDK)。开发者可以通过访问 nova.amazon.com 获取 SDK,并深入了解亚马逊旗下的各种 Nova 基础模型。这一举措体现了亚马逊积极拥抱开放生态,鼓励开发者参与到 AGI 技术的创新中来。

Nova Act 由亚马逊新成立的旧金山 AGI 实验室研发,该实验室由前 OpenAI 研究员 David Luan 和 Pieter Abbeel 共同领导,汇聚了业界顶尖人才。据透露,Nova Act 未来将为备受瞩目的生成式 AI 增强版语音助手 Alexa+ 提供关键功能支持,使其能够更加智能地理解用户需求并执行相关操作。虽然目前开放的版本为“研究预览版”,功能尚待完善,但也足以看出亚马逊在 AGI 领域的雄心和布局。
亚马逊表示,Nova Act SDK 将赋予开发者自动化处理基础性网络操作的能力,例如在线订购餐饮、预订餐厅晚餐等。通过 SDK,AI 智能体可以轻松浏览网页、填写表单以及选择日历日期,从而显著提升现有 AI 聊天机器人的实用性和效率。这种自动化能力 potentially 将改变用户与网络服务的交互方式。
在性能方面,亚马逊声称 Nova Act 在公司内部的多项测试中表现优异,超越了 OpenAI 和 Anthropic 等竞争对手的同类智能体。例如,在 ScreenSpot Web Text 测试中,Nova Act 的得分高达 94%,而 OpenAI 的 CUA 和 Anthropic 的 Claude 3.7 Sonnet 分别得分为 88% 和 90%。然而,值得注意的是,亚马逊并未公布 Nova Act 在其他更常用的智能体评估基准上的测试结果,这使得对其整体性能的评估仍需进一步的验证。客观而言,仅凭单一测试结果难以全面评估智能体的综合能力。
对于为何一个以 AGI 为目标的实验室会选择开发订购沙拉之类的 AI 智能体,David Luan 认为,智能体是构建超智能 AI 系统的关键步骤。他将 AGI 定义为一个能够帮助人类在计算机上完成任何任务的 AI 系统。Nova Act SDK 的目标是可靠地自动化执行简短、简单的任务,并为开发者提供精确定义何时需要人类介入智能体工作流程的工具,从而实现人机协作的优化。
当前,市场上的早期 AI 智能体普遍面临跨领域应用时可靠性不足的挑战。这些系统往往运行缓慢,难以长时间独立工作,且容易出现错误。因此,业界对亚马逊是否找到了克服这些难题的有效方法充满期待。尽管前景广阔,但 Nova Act 智能体能否在激烈的竞争中脱颖而出,并真正解决用户的实际需求,仍然有待市场检验和开发者们的持续创新。