2月18日,伊隆·马斯克宣称的“地球上最聪明的人工智能”终于揭开了神秘面纱。其旗下人工智能公司xAI正式发布了新一代的大语言模型Grok 3,并且马斯克本人也在社交平台X上同步进行了直播演示,吸引了全球科技爱好者的目光。
根据直播中的介绍,Grok 3在性能上声称超越了目前市场上所有已发布的人工智能模型。xAI官方公布的测试数据显示,Grok 3在数学推理、科学逻辑推理以及代码写作等关键领域的表现,均优于ChatGPT-4o、DeepSeek-V3等竞争对手,展现出强大的实力。
Grok大模型是马斯克创立的xAI公司推出的重要人工智能产品,其命名灵感来源于美国科幻作家罗伯特·海因莱因的经典小说《异乡异客》(Stranger in a Strange Land),寓意着其探索AI未知领域的雄心。
Grok系列的首款大模型Grok 1于2023年11月问世,并在2024年迅速扩展至3140亿参数,远远超过了GPT-3.5的1750亿。2024年8月,Grok 2大模型发布,在Grok 1的基础上进行了全面的升级,并开始在X平台上面向用户提供免费使用,体现了xAI的开放姿态。
而此次发布的Grok 3,据工程师透露,其训练规模是Grok 2的10倍之巨,并且已经在xAI内部稳定运行了2周,经历了充分的内部验证。
据悉,Grok 3的训练使用了总计20万个GPU,在第一阶段使用了10万个GPU进行训练,耗时144天。在第二阶段的92天中,所使用的GPU数量更是增加到了20万个,展现了惊人的算力投入。
作为对比,印度已经启动了一个拥有超过1.8万个GPU的公共计算设施,旨在向初创公司、研究人员和开发者开放,以促进其国内人工智能的发展以及本国大语言模型的训练。 可以看到,Grok 3的训练规模远超目前的国家级AI项目。
与印度国家级项目相比,xAI的Grok 3训练所使用的GPU总量超过了其10倍以上。如此庞大的算力规模,无疑是Grok 3能够加速问世的最大助力,也给予了xAI在日益激烈的市场竞争中充足的底气。
在直播活动中,xAI的工程师现场演示了Grok 3的强大功能,包括生成一段太空发射的3D动画的代码、快速制作一款融合“宝石迷阵”和“俄罗斯方块”元素的游戏。Grok 3在这些复杂任务中均表现出色,充分证明了该模型对于复杂知识具有良好的理解和应用能力。马斯克更是直言,Grok 3的功能比Grok 2强大了一个数量级。
面对Grok 3的优异表现,知名博主Alexandr Wang对Grok 3赞不绝口,认为它是世界上新的最佳模型,并在聊天机器人竞技场中排名第一,且遥遥领先。
Amjad Masad也表示Grok 3似乎是最先进的尖端模型,并认为考虑到xAI的处境,该模型的发布无疑是一项巨大的成就。知名播客主持人Lex Fridman同样对该模型印象深刻,表达了对该模型的称赞之情。
Grok 3所带来的震撼,实际上比该模型的正式面世还要早。早在发布之前,Grok 3就引发了业界的广泛关注,成为AI领域的热门话题。
此前,DeepSeek凭借其R1模型在全球范围内掀起了一股热潮。由于DeepSeek-R1模型的优秀表现,以及其代表的低成本训练路线,人们一度开始讨论全球AI话语权的归属问题。虽然人工智能行业仍处于群雄逐鹿的阶段,但DeepSeek-R1模型的出现无疑对整个行业带来了巨大的冲击。
在DeepSeek爆火之后,2月13日,OpenAI首席执行官奥特曼发布博文,宣布准备推出GPT-4.5和GPT-5,并公布了详细的路线图,试图巩固其在AI领域的领先地位。
同样在2月13日,马斯克在迪拜世界政府峰会上表示,xAI将推出新一代模型Grok 3,并盛赞其“强到让人感到害怕”,进一步引发了人们对Grok 3的强烈好奇和期待,也让关于AI话语权可能再度向西方倾斜的讨论甚嚣尘上。
至此,一场有关人工智能模型的“三国杀”格局已见雏形,OpenAI、xAI和DeepSeek三家公司成为了这场技术竞赛中的主要参与者。
作为xAI的重要市场竞争对手,OpenAI对Grok 3的反应也引起了人们的关注。在马斯克直播活动开始之前,奥特曼在社交平台X发布消息,称GPT-4.5已进入测试阶段,并称其体验“接近通用人工智能(AGI)”,此举被外界解读为对Grok 3的紧急“狙击”,试图先发制人,保持自身优势。
从公布的数据来看,在 “推理+测试时间计算”中,Grok 3 Reasoning Beta版本在数学推理、科学逻辑推理和编程三个方面的综合得分分别为93、85、79,均高于DeepSeek-R1的80、71和65。而在最新的AIME 2025性能测试中,Grok 3 Reasoning Beta版本的得分为93分,也高于DeepSeek-R1的成绩。
前特斯拉人工智能总监、OpenAI创始团队成员Andrej Karpathy通过提前体验指出,Grok 3模型确实可以做到DeepSeek-R1无法做到的事情。从目前已知的测试数据来看,Grok 3的性能确实略优于DeepSeek-R1。
不过,虽然Grok 3在测试中表现出色,但也有分析指出,在 “推理+测试时间计算” 这一测试中,Grok 3的数学性能相比于o3-mini(high)或DeepSeek-R1并没有显著的优势。对此,马斯克表示,Grok 3仍处于早期训练阶段,未来将持续进行优化,不断提升其性能。
据悉,X平台Premium Plus订阅用户将率先获得Grok 3的访问权限。此外,xAI还推出了名为Super Grok的独立订阅服务,但尚未公开其具体定价。马斯克还透露,xAI的工程师团队正在训练Grok 3的迷你版本,并指出“迷你版的训练时间更长,但有时表现略好于Grok 3推理模型”,令人十分期待。
自Grok 3发布以来,马斯克“再无AI比Grok更优秀”的预言能否成真?在人工智能技术日新月异的今天,下结论还为时过早。但就目前Grok 3的表现来看,马斯克确实在人工智能的牌局上打出了一张极具分量的大牌,并对现有格局产生了影响。





