马斯克Grok 3能否超越DeepSeek

2月18日，伊隆·马斯克宣称的“地球上最聪明的人工智能”终于揭开了神秘面纱。其旗下人工智能公司xAI正式发布了新一代的大语言模型Grok 3，并且马斯克本人也在社交平台X上同步进行了直播演示，吸引了全球科技爱好者的目光。

根据直播中的介绍，Grok 3在性能上声称超越了目前市场上所有已发布的人工智能模型。xAI官方公布的测试数据显示，Grok 3在数学推理、科学逻辑推理以及代码写作等关键领域的表现，均优于ChatGPT-4o、DeepSeek-V3等竞争对手，展现出强大的实力。

Grok大模型是马斯克创立的xAI公司推出的重要人工智能产品，其命名灵感来源于美国科幻作家罗伯特·海因莱因的经典小说《异乡异客》（Stranger in a Strange Land），寓意着其探索AI未知领域的雄心。

Grok系列的首款大模型Grok 1于2023年11月问世，并在2024年迅速扩展至3140亿参数，远远超过了GPT-3.5的1750亿。2024年8月，Grok 2大模型发布，在Grok 1的基础上进行了全面的升级，并开始在X平台上面向用户提供免费使用，体现了xAI的开放姿态。

而此次发布的Grok 3，据工程师透露，其训练规模是Grok 2的10倍之巨，并且已经在xAI内部稳定运行了2周，经历了充分的内部验证。

据悉，Grok 3的训练使用了总计20万个GPU，在第一阶段使用了10万个GPU进行训练，耗时144天。在第二阶段的92天中，所使用的GPU数量更是增加到了20万个，展现了惊人的算力投入。

作为对比，印度已经启动了一个拥有超过1.8万个GPU的公共计算设施，旨在向初创公司、研究人员和开发者开放，以促进其国内人工智能的发展以及本国大语言模型的训练。可以看到，Grok 3的训练规模远超目前的国家级AI项目。

与印度国家级项目相比，xAI的Grok 3训练所使用的GPU总量超过了其10倍以上。如此庞大的算力规模，无疑是Grok 3能够加速问世的最大助力，也给予了xAI在日益激烈的市场竞争中充足的底气。

在直播活动中，xAI的工程师现场演示了Grok 3的强大功能，包括生成一段太空发射的3D动画的代码、快速制作一款融合“宝石迷阵”和“俄罗斯方块”元素的游戏。Grok 3在这些复杂任务中均表现出色，充分证明了该模型对于复杂知识具有良好的理解和应用能力。马斯克更是直言，Grok 3的功能比Grok 2强大了一个数量级。

面对Grok 3的优异表现，知名博主Alexandr Wang对Grok 3赞不绝口，认为它是世界上新的最佳模型，并在聊天机器人竞技场中排名第一，且遥遥领先。

Amjad Masad也表示Grok 3似乎是最先进的尖端模型，并认为考虑到xAI的处境，该模型的发布无疑是一项巨大的成就。知名播客主持人Lex Fridman同样对该模型印象深刻，表达了对该模型的称赞之情。

Grok 3所带来的震撼，实际上比该模型的正式面世还要早。早在发布之前，Grok 3就引发了业界的广泛关注，成为AI领域的热门话题。

此前，DeepSeek凭借其R1模型在全球范围内掀起了一股热潮。由于DeepSeek-R1模型的优秀表现，以及其代表的低成本训练路线，人们一度开始讨论全球AI话语权的归属问题。虽然人工智能行业仍处于群雄逐鹿的阶段，但DeepSeek-R1模型的出现无疑对整个行业带来了巨大的冲击。

在DeepSeek爆火之后，2月13日，OpenAI首席执行官奥特曼发布博文，宣布准备推出GPT-4.5和GPT-5，并公布了详细的路线图，试图巩固其在AI领域的领先地位。

同样在2月13日，马斯克在迪拜世界政府峰会上表示，xAI将推出新一代模型Grok 3，并盛赞其“强到让人感到害怕”，进一步引发了人们对Grok 3的强烈好奇和期待，也让关于AI话语权可能再度向西方倾斜的讨论甚嚣尘上。

至此，一场有关人工智能模型的“三国杀”格局已见雏形，OpenAI、xAI和DeepSeek三家公司成为了这场技术竞赛中的主要参与者。

作为xAI的重要市场竞争对手，OpenAI对Grok 3的反应也引起了人们的关注。在马斯克直播活动开始之前，奥特曼在社交平台X发布消息，称GPT-4.5已进入测试阶段，并称其体验“接近通用人工智能（AGI）”，此举被外界解读为对Grok 3的紧急“狙击”，试图先发制人，保持自身优势。

从公布的数据来看，在 “推理+测试时间计算”中，Grok 3 Reasoning Beta版本在数学推理、科学逻辑推理和编程三个方面的综合得分分别为93、85、79，均高于DeepSeek-R1的80、71和65。而在最新的AIME 2025性能测试中，Grok 3 Reasoning Beta版本的得分为93分，也高于DeepSeek-R1的成绩。

前特斯拉人工智能总监、OpenAI创始团队成员Andrej Karpathy通过提前体验指出，Grok 3模型确实可以做到DeepSeek-R1无法做到的事情。从目前已知的测试数据来看，Grok 3的性能确实略优于DeepSeek-R1。

不过，虽然Grok 3在测试中表现出色，但也有分析指出，在 “推理+测试时间计算” 这一测试中，Grok 3的数学性能相比于o3-mini（high）或DeepSeek-R1并没有显著的优势。对此，马斯克表示，Grok 3仍处于早期训练阶段，未来将持续进行优化，不断提升其性能。

据悉，X平台Premium Plus订阅用户将率先获得Grok 3的访问权限。此外，xAI还推出了名为Super Grok的独立订阅服务，但尚未公开其具体定价。马斯克还透露，xAI的工程师团队正在训练Grok 3的迷你版本，并指出“迷你版的训练时间更长，但有时表现略好于Grok 3推理模型”，令人十分期待。

自Grok 3发布以来，马斯克“再无AI比Grok更优秀”的预言能否成真？在人工智能技术日新月异的今天，下结论还为时过早。但就目前Grok 3的表现来看，马斯克确实在人工智能的牌局上打出了一张极具分量的大牌，并对现有格局产生了影响。

免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，可联系本站进行审核删除。

2025 年 2 月
一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28

马斯克Grok 3能否超越DeepSeek

相关推荐

发表回复