在编程能力上相比上一代 GLM-5 直接飙升近 10 分
梦瑶 发自 凹非寺
AI快讯网 |
当全球大模型竞赛持续升温,代码生成领域的军备竞赛早已成为了各家技术实力的试金石。智谱此次的突然发难,显然不是简单的版本迭代,而是针对当前开源与闭源大模型在生产力工具维度的一次强力反击。
从模型生态的角度来看,Coding Plan 的全面开放意味着智谱试图将 AI 编程助手从“锦上添花”转变为“不可或缺”的基础设施。在开发者工作流中,模型能否无缝嵌入、是否具备多步规划能力,已成为衡量技术成熟度的关键指标。
智谱GLM-5.1,突然上线!
官方公告只有寥寥两句:
GLM-5.1 现已面向 GLM Coding Plan 全部用户 (Lite/Pro/Max) 开放。
ModelKey:GLM-5.1
别的没再多说,只是默默甩出 Coding Evaluation 评测结果——
在编程能力上相比上一代 GLM-5 直接飙升近10 分。
甚至嘛,距全球最强编程模型 Claude Opus 4.6,也就只有2.6 分之差??
虽说榜单上的对比模型不多,但架不住网友脑补空间大啊,这下大家哪还能坐得住:
网友:既然 GLM-5.1 的评分都快贴到 Opus 脸上了,那岂不是意味着…
很可能已经超过——
目前仅次于 Opus 4.6 的 Sonnet4.6 模型了??
要是这样的话…那网友们直接反手就是一个实测大整活儿!!
看下面这位小哥,连夜搓出来了个AI 版「我的世界」,还能带交互的内种,有点大型游戏那味儿了啊:
还有网友直接把模型安排到自己日常工作流里了。
下面这位朋友直接把关于灵巧手的研究资料喂给了 GLM-5.1 后,就得到了一本专业的行业手册!
(良心评价:输出的效果忒意外,远超我的预期~)
此外值得一提的是,此次的 GLM-5.1 版本率先向 GLM Coding Plan所有用户开放。
结果您猜怎么着,太爆了,直接爆到《售罄》了…(doge)
是的,模型也能卖断货了。
(正在狠狠排队候补 ing!!!)
u1s1,除了官方给出的那份 Coding Evaluation 外,这次智谱貌似连文档都还没好好写……
但从现有资料文档和网友的实测效果中,我们也能对 GLM-5.1 的模型能力有个大概齐的了解~
先来说说大家最为关心的模型基本信息:
- 上下文窗口:大约在 200K 级别,基本延续了 GLM-5 的配置,在量级上没有太大变化。
- 模型能力:从知识库文档的标题中也不难得出——模型定位主要还是偏代码场景,此外支持 reasoning 模式。
- 模型配置:目前支持在 Claude Code 里手动切换使用,同时也能接入 OpenClaw 进行自定义配置。
- 接口兼容:支持 OpenAI Compatible 接入,接入入门槛基本被压到了最低,对开发者来说不用改太多代码就能让模型跑在工作流里~
- 模型开放对象:面向所有 GLM coding plan 用户。(是的,Lite 用户也能用了~)
光说性能还是忒抽象!咱们直接拿已经抢先尝鲜网友们的实测效果,看看模型表现到底如何~
先来看看 youtube 上@AICodeKing网友大神的实测效果!
下面这个室内设计平面图就是小哥用 GLM-5.1 做出来的。
从输出效果来说,像厨房、客厅、卧室这些区域的划分都比较明确,甚至连动线关系都有点像那么回事。
我们其实能得出一个比较直接的判断——模型对空间结构的理解能力还是蛮到位的~
人家小哥也这么觉得。
他说他还拿这次 GLM-5.1 的模型和上一代模型进行了效果对比,确实觉得 GLM-5.1 的效果更好一些:
还有这个,他又尝试进行了游戏搭建,用 GLM-5.1 做了个可交互的国际象棋网页游戏,be like:
此外,他还用 GLM-5.1 搓出来了个在线版「我的世界」。
随着镜头的移动画面也没有出现卡顿的情况,而且模型对于未知画面的也能脑补出相应的画面。
在这个实测效果里,我们已经能浅浅推断出 GLM-5.1 模型在几个关键能力上的表现:
一是「空间一致性」。
场景、视角、交互是一起生成的,这说明模型在处理连续环境时,能呈现出一个相对稳定的空间状态。
二是「动态补全能力」。
随着镜头移动,对未出现区域的内容可以继续往下生成,也说明模型具备比较强大的持续构建环境的能力。
当然,除了这些实测和参数信息之外,我们从其他维度上也能对模型有更深的判断,那就是——「版本发布节奏」。
是的,这次 GLM-5.1 模型距离上一代 GLM-5 模型的发布,也就隔了一个多月的时间…
也就是说,这一代还处在一个非常快的迭代周期里。
所以说虽然版本不同,但两代在能力定位上是延续的,在 GLM-5 当时的公开资料里,就已经提到它在编程场景下的表现,已经逼近 Claude Opus 4.5。
所以也不难得出的一个结论是——
GLM-5.1 更像是上一代模型基础上的强化版本,这一代的提升,也会更多体现在稳定性、执行效率,以及复杂任务下的表现上。
问题来了,GLM-5.1 咋具体配置呢,我们也帮大家浅浅整理了一下!
在配置层面,GLM-5.1 目前已经支持接入 Claude Code、OpenClaw 等平台使用。
- 方法一:在终端中运行vim ~/.claude/settings.json打开并编辑文件。完成后,按 Esc,输入:wq,保存你的更改。
- 方法二:访达→前往文件夹→输入~/.claude/settings.json找到并编辑配置文件。
或者大家也可以直接用 Claude Code 代码来询问:
使用 GLM-5.1,需要在配置文件settings.json中,添加或替换如下环境变量参数:
{
"env": {
"ANTHROPIC_DEFAULT_HAIKU_MODEL": "GLM-4.5-air",
"ANTHROPIC_DEFAULT_SONNET_MODEL": "GLM-5.1",
"ANTHROPIC_DEFAULT_OPUS_MODEL": "GLM-5.1"
}
}
启动一个新的命令行窗口,运行 claude 启动 Claude Code,在 Claude Code 中输入/status确认模型状态:
值得注意的是,官方说法是模型目前只能用于可以自定义模型的 Coding Agent。
若大家使用的 Agent 工具不能设置自定义模型,需要等待官方后续配置~
(我还在苦苦候补订阅中,感兴趣的朋友可以直接上手试试~)
纵观这一周的科技圈动态,国产大模型在垂直领域的深耕愈发清晰。GLM-5.1 的快速迭代不仅展示了技术实力的积累,更暴露出当前大模型市场的一个趋势:速度即正义。在通用大模型能力趋同的背景下,谁能更快地响应开发者反馈,谁能更早解决实际工程问题,谁就能抢占下一个 AI 原生应用爆发的先机。随着更多 Agent 工具的接入,这类编程专用模型的边界还将进一步模糊,最终回归到提升人类创造力的本质。