在人工智能(AI)领域,智谱公司于3月31日发布AutoGLM沉思智能体,标志着国产AI Agent技术取得重大突破。该智能体不仅专注于深度研究(Deep Research),更强调从理论到实践的转化,致力于将AI Agent推向“思考即行动”的新阶段。这一里程碑事件预示着AI技术在自主性、决策能力和实际应用方面的巨大潜力。
AutoGLM沉思的研发历经多个关键阶段,由GLM-4基座模型出发,经过GLM-Z1推理模型,进一步发展至GLM-Z1-Rumination沉思模型,最终形成完整的AutoGLM模型。智谱公司宣布,核心技术与模型计划于4月14日全面开源。此举无疑将加速AI Agent技术的普及和创新,允许更多的开发者参与到该领域的研究与应用中,促进整个AI生态的繁荣。
回顾智谱在AI Agent领域的探索,从2023年10月推出具备函数调用能力的智谱清言,到2024年1月上线支持智能体编排的GLMs,再到同年10月发布设备操控智能体AutoGLM,每一步都体现了该公司的持续创新精神。此次发布的AutoGLM沉思模型,更是集深度研究与实际操作能力于一身,既是自主智能体技术的重要进展,也是设备操控智能体的重大升级。
AutoGLM沉思的核心竞争力在于其具备的深度思考、感知世界和工具使用能力。 它能够模拟人类在面对复杂问题时的推理和决策过程,获取并理解环境信息,并调用和操作工具以完成复杂任务。与OpenAI的Deep Research相比,AutoGLM沉思并不仅仅局限于深入研究,更注重成果的实际转化,是一种“能干活”的智能体。这种从思考到执行的转变,提升了AI在解决实际问题中的效率和价值。
AutoGLM沉思背后的技术核心是智谱自主研发的Agent大脑——沉思模型。该模型通过强化学习,具备了自我批评、反思和沉思的能力,并通过更长时间的深度思考来优化结果。 实时联网搜索、动态工具调用、深度分析和自我验证等功能的集成,推动了AI Agent在长程推理和复杂任务执行能力上的飞跃。这种自我完善机制是提升AI智能的关键,使其能够更好地适应复杂多变的环境。
目前,AutoGLM沉思功能已在智谱清言的PC客户端上线,用户可以免费体验其强大的研究能力和操作能力。此次发布的预览版本主要支持研究场景。 智谱计划在未来两周内扩展智能体的执行能力,包括推出“虚拟机”版本,以增强AI Agent的实际应用能力。 此外,沉思功能已在智谱清言的网页端、PC端和手机App正式上线,并向公众免费开放,成为国内首个正式开放的Deep Research功能。 这为广大用户提供了一个亲身体验新型AI Agent技术的平台。
AutoGLM沉思的成功得益于智谱自主研发的全栈大模型技术,该技术融合了GLM-4的通用能力、GLM-Z1的反思能力、GLM-Z1-Rumination的沉思能力以及AutoGLM的自动执行能力。 新版基座模型GLM-4-Air-0414以320亿参数量对标国内外主流大模型,并显著增强了工具调用、联网搜索和代码等智能体任务能力。 新款推理模型GLM-Z1-Air在性能上可媲美DeepSeek-R1,并在推理速度上提升了8倍,成本降低至1/30,进一步降低了开发者在硬件方面的投入门槛。 这表明智谱在深度学习模型方面的创新,不仅关注性能提升,也兼顾了成本效益。
在斯坦福大模型中心选定的智能体基准评测AgentBench上,AutoGLM系列模型在多个测试环境中取得了SOTA(state-of-the-art)的领先成绩,充分展示了其卓越的性能。 尤其是在Phone Use和Browser Use基准测试中,AutoGLM-Phone和AutoGLM-Web超越了OpenAI GPT-4o和Anthropic Claude-3.5-Sonnet等竞品,彰显了智谱在GUI(图形用户界面)智能体领域的实力。 这些测试结果为评估AI Agent的性能提供重要的参考,也证明了智谱在特定应用场景下的优势。
展望未来,智谱将继续专注于Agentic GLM的研发,推动智能体技术的快速发展。 在技术层面,智谱将依托自主研发的大模型技术,持续推动具备逻辑推理和深度思考能力的Agent基座模型与通用基座模型的研发,并构建智能体框架与应用,朝着让机器像人一样思考和行动的目标迈进。 同时,智谱还将搭建Agentic LLM平台,助力生态合作伙伴构建行业、地域与场景深度融合的智能体应用,共同推进AI技术的创新与应用。 这种开放合作的姿态将有助于加速AI Agent技术在各个领域的落地和应用,最终实现AI技术的普惠价值。