文本领域、视觉领域双双国产第一
衡宇 发自 凹非寺
阿里你的嘴严是真的严,但手可没闲着——Qwen 3.7预览版悄无声息地上线了。
Arena(原大模型竞技场)官方账号刚刚晒出Qwen3.7-Max-Preview和Qwen3.7-Plus-Preview的最新成绩单。
文本领域,Qwen3.7-Max-Preview排第13,连带阿里实验室的总排名升至第6。
同时拿下国产第一。
视觉领域,Qwen3.7-Plus-Preview排第16,阿里总排名升至第5。
依然是排行榜上国产第一。
Qwen官号直接放话:“迫不及待想发布Qwen3.7系列了!”

等等,4月底不是才发布了Qwen3.6-Max-Preview?
Qwen3.6-Max还在预览版阶段,Qwen3.7-Max预览版就端上桌了……这节奏真是让人分不清正式版是跳票了还是迭代太猛。
但无论如何,正式版究竟什么时候放出来?
等得心焦。
一早醒来,Arena已公布Qwen3.7预览版的详细表现。
Qwen3.7-Max-Preview文本领域整体排名第13。
前面的选手包括Claude Opus 4.6/4.7系列、Gemini-3.1/3 Pro系列、GPT-5.4/5.4-High等。值得注意的是,这是Arena文本榜全球前十五中唯一的中国模型。

细分赛道更显锋芒,以下领域闯入全球前十:
- 数学:第7
- 专家提示:第9
- 软件/IT:第9
- Coding:第10

同期公布的Qwen3.7-Plus-Preview在视觉领域同样强势,排名第18,使阿里总排名冲到第5。它同样是该领域唯一位列前20的中国模型。

专家竞技场方面:Qwen3.7-Max-Preview在仅限专家提示中排名第9。同榜单上还有小米Mimo v2.5 Pro,位列第7。

还能说什么?快出正式版,快开源!我要实测。

有网友吐槽:Qwen发新模型像自动播放,上一个还没讨论完,下一个预告片就蹦出来了。
并非错觉。梳理一下Qwen的迭代时间线,事实就是如此紧凑。
(注:表格重点收录主要里程碑版本,实际还有更多细分尺寸和专项模型)

早期(2023-2024),Qwen发布节奏约4-6个月一个大版本。转折点在Qwen3系列。2025年Qwen3推出dense和MoE模型,参数量0.6B到235B,支持复杂推理与快速响应双模式。
进入2026年,迭代速度明显加码,版本间隔缩短至2-3月,甚至每月都有新动作——3.5、3.6、3.7接连登场。

惯例是Preview先行,社区先测、开发者先用,正式版随后。这背后是阿里Qwen团队已进入快速实验、高频交付的新阶段。
客观来看,这种迭代频率在大模型圈子里并不多见。通常顶级模型从Previcle版到正式版要几个月,而Qwen的版本号几乎逐月递增。这既说明团队内部工程化程度高,也反映出对竞品(如GPT、Claude)快速崛起的紧迫应对。
记得Qwen前负责人林俊旸离开时发推特:“Qwen的兄弟们按原计划继续干,没问题的”
那时Qwen还在3.5时代,与DeepSeekSeek并称国产开源标杆。如今3.7预览版的表现证明,团队并未因人事变动而减速,反而更快、更强。

从几年等一款手机升级,到几周目睹一个模型迭代——这场竞赛的节奏已被彻底改变。
有人欢呼,有人焦虑,但技术不等人。
它像一条奔腾的河,我们既是见证者,也是参与者。