阿里Qwen2.5登顶全球开源大模型榜首，Meta恐将败下阵来。

阿里云于9月19日的云栖大会上发布了通义千问的新一代开源模型Qwen2.5。这款旗舰模型Qwen2.5-72B在性能上超越了拥有4050亿参数的Llama 405B，再次登顶全球开源大模型榜首。

Qwen2.5-72B在MMLU-redux等十多个基准测评中表现超越Llama3.1-405B

Qwen2.5系列涵盖了多种尺寸的大语言模型、多模态模型、数学模型以及代码模型，每个尺寸都提供了基础版本、指令跟随版本及量化版本，总计推出了100多个模型。这一数量刷新了业界纪录，并基于18T tokens的数据进行了预训练，整体性能比Qwen2提升了18%以上。

在性能方面，Qwen2.5-72B模型在MMLU-rudex基准、MBPP基准以及MATH基准上的得分分别高达86.8、88.2和83.1，展现了其在通用知识、代码能力和数学能力方面的优势。此外，该模型还支持高达128K的上下文长度，并能生成最多8K的内容，并且拥有强大的多语言能力，支持超过29种语言，包括中文、英文、法文等。

Qwen2.5开源了7个不同尺寸的模型，从0.5B到72B，在同等参数规模下都创造了业界的最佳成绩。其中，3B尺寸的模型被视为适配手机等端侧设备的理想选择，而32B尺寸的模型因其出色的性价比而备受开发者期待，它在性能和功耗之间实现了平衡。

HuggingFace数据显示，截至9月中旬Qwen系列原生模型和衍生模型总数超过5万个

在专项模型领域，Qwen2.5也取得了显著进展。用于编程的Qwen2.5-Coder和用于数学的Qwen2.5-Math相较于前代模型都有了实质性的提升。尤其是Qwen2.5-Math，它支持使用中英双语的思维链和工具集成推理来解决数学问题，被认为是迄今为止最先进的开源数学模型系列。

在多模态模型方面，Qwen2-VL-72B正式开源。这款模型能够识别不同分辨率和长宽比的图片，理解超过20分钟的长视频内容，并具备了操作手机和机器人的视觉智能体能力。在最近的权威测评中，它被评为全球得分最高的开源视觉理解模型。

自2023年8月开源以来，通义千问在全球开源大模型领域的地位日益凸显，已逐渐成为开发者们的首选模型。其卓越的性能和不断丰富的生态网络使其赢得了广泛的赞誉和关注。

关键词：#通义千问# #Qwen2.5# #开源模型# #全球领先# #多模态能力#

免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，可联系本站进行审核删除。

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

阿里Qwen2.5登顶全球开源大模型榜首，Meta恐将败下阵来。

相关推荐

发表回复