阿里千问Qwen3.5除夕重磅登场,登顶全球最强开源模型

阿里巴巴重磅开源全新一代大模型千问Qwen3.5-Plus,登顶全球最强开源模型。该模型拥有3970亿总参数,激活仅170亿,性能超越万亿参数模型,部署显存占用降低60%,推理效率大幅提升。千问3.5实现多模态代际跃迁,在MMLU-Pro、GPQA、IFBench等多项权威评测中刷新纪录,超越GPT-5.2、Claude 4.5、Gemini 3 Pro等模型,并支持长达2小时视频输入及视觉编程。

在热闹的除夕夜,阿里巴巴出人意料地发布了一项重大消息,没有提前预热,仿佛一颗“王炸”震撼发布。

据“阿里云”公众号披露,今日,阿里巴巴向全球开源了其全新一代大语言模型——千问Qwen3.5-Plus,并宣称其性能已登顶全球最强的开源模型行列。

阿里除夕夜甩出王炸!千问Qwen3.5重磅发布 登顶全球最强开源模型

这款模型的设计颇具匠心,总参数量高达3970亿,但实际激活的参数仅为170亿。这种“以小胜大”的策略,在性能上却超越了参数量万亿级别的Qwen3-Max模型,展现了其高效的架构和优化能力。

在模型部署方面,千问Qwen3.5-Plus取得了显著的进步,显存占用降低了60%,推理效率得到了大幅提升,最大推理吞吐量甚至可以提升至原来的19倍。这意味着在实际应用中,无论是对于计算资源有限的场景,还是对响应速度要求极高的应用,都能提供更优越的体验。

目前,千问APP以及PC端已经率先集成了Qwen3.5-Plus模型。开发者们则可以通过魔搭社区和HuggingFace两大平台便捷地获取和下载这一新模型。更令人振奋的是,Qwen3.5-Plus的API定价极具竞争力,每百万Token的价格低至0.8元,这无疑将极大地降低AI技术的应用门槛,促进其广泛落地。

与此前几代千问大语言模型不同,千问3.5系列实现了从纯文本处理向原生多模态能力的重大跨越。这一代模型在预训练阶段便融合了视觉与文本信息,采用了混合Token策略,并且显著增加了中英文、多语言、STEM(科学、技术、工程、数学)以及推理等类型的数据,使其能够更好地理解和处理包含图像、文本等多种模态的信息。

在严格的学术评测中,千问3.5的表现尤为突出。在MMLU-Pro认知能力评测中,它取得了87.8的高分,超越了GPT-5.2。在博士级别的复杂难题GPQA测评中,千问3.5斩获88.4分,优于Claude 4.5。而在指令遵循任务IFBench上,它以76.5分的成绩创造了所有模型的最新纪录。

此外,在通用Agent能力评测BFCL-V4以及搜索Agent评测Browsecomp等一系列基准测试中,千问3.5的表现均超越了业界领先的Gemini 3 Pro。这一系列成就表明,千问3.5在执行复杂任务、理解指令以及进行自主决策方面,已达到或超越了当前最先进的水平。

不仅如此,在多模态理解的多个细分领域,千问3.5也展现出了强大的实力。在多模态推理(MathVison)、通用视觉问答(RealWorldQA)、文本识别与文件理解(CC_OCR)、空间智能(RefCOCO-avg)以及视频理解(MLVU)等权威评测中,千问3.5均取得了最佳表现。尤其值得一提的是,在视频理解方面,它能够支持长达2小时(相当于1M token上下文)的视频直接输入,这对于长视频内容的深度分析和摘要生成具有重大意义。

千问3.5的另一项突破性进展是实现了视觉理解与代码能力的深度融合。通过结合图搜和生图工具,它可以将用户手绘的界面草图直接转化为可用的前端代码,甚至通过一张截图就能定位并解决UI设计中的问题,真正将视觉编程变成了高效的生产力工具,极大地降低了开发门槛,提升了开发效率。

阿里除夕夜甩出王炸!千问Qwen3.5重磅发布 登顶全球最强开源模型

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行审核删除。
(0)
Rain科技Rain科技
上一篇 2026年 2月 16日 下午5:09
下一篇 2026年 2月 16日 下午7:57

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

欢迎来到AI快讯网,开启AI资讯新时代!