智谱发布新一代开源模型,极速版最高达到200tokens/秒

AI快讯网4月15日消息,今日,智谱发布新一代开源模型GLM-4-32B-0414系列,包含基座、推理、沉思模型权重,并遵循MIT License。目前系列所有模型可以通过“z.ai”访问体验。据介绍,推理模型GLM-Z1-Air/AirX-0414模型推理速度可以做到最高200 Tokens/秒(MaaS平台bigmodel.cn上实测),这也是目前国内迄今最快的商业模型,而且GLM-Z1-Air-0414 的价格仅需DeepSeek-R1的1/30。

上一篇:

下一篇:

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

欢迎来到AI快讯网,开启AI资讯新时代!