近期,一家来自麻省理工学院(MIT)的初创公司 OpenAGI 携其最新研发的AI模型 Lux 正式亮相。这款模型在计算机操作任务上的表现,不仅超越了来自 OpenAI 和 Anthropic 的同类产品,且成本仅为其十分之一。OpenAGI 的 CEO 秦增义表示,Lux 是一个能够通过分析电脑屏幕截图,自动执行桌面应用程序操作的 foundational model(基础模型)。
在最新的 Online-Mind2Web 基准测试中,Lux 取得了 83.6% 的成功率,这一数字远超 OpenAI 的 Operator(61.3%)和 Anthropic 的 Claude Computer Use(56.3%)。在自动化操作与AI代理日益受到重视的当下,如此显著的性能优势,无疑为 Lux 的技术实力在业界引发了广泛关注和高度期待。
与传统的通用型大语言模型不同,Lux 采用了“Agent-based pre-training”(基于代理的预训练)方法,其学习过程高度聚焦于计算机屏幕截图和一系列动作指令。这种自我强化的训练循环,使得 Lux 能够通过不断的探索和实践来持续提升自身能力,从而在执行计算机操作时展现出更高的效率和精准度。这标志着AI在理解和交互真实桌面环境方面迈进了一大步。
OpenAGI 对外宣称,Lux 的运营成本大约是 OpenAI 和 Anthropic 顶级模型成本的十分之一,并且在执行速度上也有显著优势。更关键的是,不同于许多竞品只能处理浏览器内的任务,Lux 能够完全掌控 Excel、Slack 等一系列桌面应用程序,这极大地拓宽了其应用场景和市场潜力。公司还同步发布了开发者软件开发工具包(SDK),赋能第三方开发者基于 Lux 构建更多创新应用。
在日益凸显的AI安全问题上,OpenAGI 为 Lux 内置了多重安全机制。当模型接收到可能违反安全策略的指令时,它会主动拒绝执行,并向用户发出警报。在AI代理快速发展的今天,这一安全特性对于保护用户数据和操作安全至关重要,足以见证其对负责任AI的坚持。
OpenAGI 的创始人秦增义拥有扎实的学术背景,并曾深度参与多个广受欢迎的AI模型的研发工作。他的团队证明了,即便是在技术巨头林立的领域,小型团队也能通过聚焦特定问题和创新方法,孕育出具有颠覆性潜力的新技术。
核心亮点速览:
– 🚀 OpenAGI 推出的 Lux AI 代理在计算机操作基准测试中,成功率高达 83.6%,遥遥领先 OpenAI 和 Anthropic.
– 💡 Lux 采用独特的学习方式,通过计算机屏幕截图与动作序列进行训练,具备自我强化能力。
– 🔒 Lux 内置安全机制,能识别并拒绝潜在危险指令,保障用户数据与操作安全。