争光了!中国AI大模型全球排名第一

最近OpenAI宣布封禁中国地区API调用,引发了广泛关注。而就在第二天,全球著名开源平台Hugging Face发布了最新一期的AI开源大模型排行榜,结果显示,中国AI大模型成功登顶,取得了全球排名第一的成绩,这一消息无疑让人振奋。

争光了!中国AI大模型全球排名第一

根据这份榜单,阿里的通义千问大模型 Qwen2-72B 再次登顶,成为全球开源大模型排行榜的NO.1!排名第二的是脸书的llama3。令人意外的是,阿里之前开源的Qwen1.5基础和Chat版本也都上榜了。

争光了!中国AI大模型全球排名第一

也就是说,这份榜单的前10名中,阿里就占了4个,这一成绩让中国的AI开源大模型在全球范围内扬眉吐气。

争光了!中国AI大模型全球排名第一

有人可能会问,为什么没有百度的AI大模型? 这是因为百度的AI大模型不开源,Hugging Face无法对其进行测评。这份榜单只针对开源模型进行排名,所以最终阿里的AI大模型排名第一。

值得注意的是,此次 Hugging Face 的评测流程也发生了重大变化:

Hugging Face 提出了更具有挑战性的V2榜单,基于无污染、高质量数据集的新基准,并采用了更加可靠的度量标准。V2榜单涵盖的一般任务包括:知识测试、短文本和长文本的理解推理、复杂的数学能力,以及与人类偏好高度相关的任务如指令遵循。榜单内的测试集更加难、更好、更快、更强,对模型的考察也更有说服力。

因为之前的V1榜单被过度使用,而且题目相对简单,导致一些新近出现的模型出现数据污染的迹象,所以老的评测方法不再适用。

此外,Hugging Face 使用了整整300块英伟达H100显卡,对全球100多个主流开源大模型进行了测试。这意味着,截至目前,Hugging Face 是全球最权威的开源模型榜单。

争光了!中国AI大模型全球排名第一

英伟达H100显卡,在日本的价格约为21.6万元一块。300块H100意味着巨大的投入,可见 Hugging Face 拥有雄厚的资源和实力。

与此同时,Hugging Face 的联合创始人Clem 也在推特 (现已更名为 X) 上发布了消息,称阿里最新开源的通义千问 Qwen2-72B 指令微调版本卫冕冠军,继续位列全球开源模型排行榜第一名。

争光了!中国AI大模型全球排名第一

这条推特也证明了 Hugging Face 官方对阿里 AI 开源大模型的认可,中国在全球开源大模型领域处于领导地位!

Hugging Face 自身也是一家开源模型库网站平台,被誉为大模型时代的“GitHub”。对于从事 AI 工作的人来说,Hugging Face 就是一个宝藏库,里面有海量实用的工具和资源,所以它发布的开源模型排行榜非常具有公信力。

国内很多公司也采用了类似的模式,发布榜单以提升自身权威性。例如,一家公司曾发布过一个自媒体排行榜,卢松松也获得了不错的排名,并因此接到了广告,对双方来说都是有益的。这一事件也让我对该排行榜充满感激。

以上内容或多或少带有一些推测,接下来,我们来谈谈我对这一事件的观点:

(1) 这份榜单的意义何在?

这份榜单相当于给国内很多套壳 AI 工具的企业打了一针兴奋剂,告诉他们:除了 OpenAI 之外,我们自己的 AI 工具也能派上用场。

争光了!中国AI大模型全球排名第一

自从 OpenAI 屏蔽中国用户使用 API 接口后,中国的一些大模型企业瞬间变得兴奋起来,因为他们无法再使用 OpenAI 来开发套壳应用。而国内 AI 大模型因此迎来了发展机遇,这份榜单的发布,也是对 OpenAI 封禁的最佳回应。

我们应该感谢 OpenAI 的封禁,因为它促进了国内 AI 大模型的发展。

如果您对通义千问 Qwen2-72B 感兴趣,也希望开发 AI 工具,您可以从这里下载:https://huggingface.co/Qwen/Qwen2-72B-Instruct

(2) 现阶段中国的 AI 实力到底如何?

由于芯片、算力和人才等因素的影响,美国的 AI 更侧重于底层架构。他们提供上层建筑供人使用,但地基必须由他们掌控。

而中国由于受到美国的出口管制,AI 应用主要集中在“应用层面”,例如医疗、港口、矿场等领域。当然,我们普通人接触最多的还是用 AI 写文章、写论文。我最近就用 AI 智能体为客户撰写行业文章,这也可以算作 AI 应用的一种。

争光了!中国AI大模型全球排名第一

中国 AI 的格局也已初步形成:

以 AI 开源为主的阿里,同时也在不断投资各种 AI 大模型,C 端层面以通义系列、百炼平台为主。以闭源为主的百度,其能力尚不明确。C 端层面以文心一言、萝卜快跑为主。

两家巨头,阿里和百度,走了截然相反的道路。

那么,中国 AI 的实力到底如何?我认为目前还没有人能够给出明确的答案。但有一点可以确定的是,最终还是要靠用户量和收入来衡量,从应用层面、盈利模式、用户规模这三个维度去判断。

写作最后:

中国 AI 的实力不容小觑,只是很多人还没有意识到这一点。此次排行榜,阿里用实力证明了,中国 AI 技术并不比国外的差,甚至还遥遥领先。

如今 AI 开源大模型,阿里已成为领头羊。尽管 OpenAI 禁止使用,但相信不久的将来,会有越来越多的人使用阿里的通义千问 Qwen2-72B。

希望阿里能够顶住压力,砥砺前行,不断突破,攀登更高的峰顶。

    免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行审核删除。
    (0)
    上一篇 2024年 7月 2日 上午9:40
    下一篇 2024年 7月 2日 上午10:00

    相关推荐

    欢迎来到AI快讯网,开启AI资讯新时代!