临近圣诞,本应是全球科技圈充斥着节日气氛的时刻,然而谷歌却选择此时发布其最新一代AI模型Gemini 3 Flash,打破了平静。
此次更新距离Gemini 3 Pro发布仅一个月,距离2.5 Pro Flash的推出也不过半年,谷歌声称这是迄今为止一次重大升级。

自从Gemini 2.5 Pro上线以来,其强大的能力已让用户对其“一搜便知”的特性习以为常,并从模型升级中获益良多。然而,此前Gemini系列在某些方面确实存在体验不足之处,例如模型倾向于过度思考,即便是一些简单的问题也可能需要较长的处理时间。
针对这一痛点,推出Flash版本无疑是一种有效的解决方案。而谷歌在Gemini 3 Flash上的表现,也确实赢得了广泛赞誉。
用国内新能源汽车厂商的宣传语来说,Gemini 3 Flash堪称“入门即旗舰,标配即别家满配”。过去,Flash系列模型给人的印象通常是速度快、成本低,但在智能性和逻辑推理能力上有所欠缺。它们或许能胜任长文档总结等任务,却难以应对复杂的代码编写或深入的逻辑分析,常常导致“胡编乱造”的情况。
但此次Gemini 3 Flash的表现却令人惊艳。谷歌宣称,其智力水平并未因此下降,反而实现了速度和效率的双重提升,甚至在性能上超越了上一代旗舰模型Gemini 2.5 Pro。

更令人瞩目的是,Gemini 3 Flash在多项测试中表现出色,能够与更庞大的顶级模型匹敌。在MMMU Pro评测中,Gemini 3 Flash取得了81.2%的优异成绩,追平了自家最新的旗舰模型3 Pro。甚至在某些情况下,它展现出了超越3 Pro的实力。
在SWE-bench编码基准测试中,Gemini 3 Flash得分78%,仅次于GPT-5.2,表现超过了3 Pro。

令其他大模型厂商倍感压力的是,Gemini 3 Flash如此出色的表现,其定价却极为亲民。数据显示,其价格仅为输入0.5美元/百万Token,输出3美元/百万Token。这意味着,完成同一任务,其成本可能比2.5 Pro低三成,而速度却能提升三倍。
谷歌方面也表示,Gemini 3 Flash的发布将能帮助众多企业更高效地处理批量任务,从而显著降低成本和缩短时间。
尽管Gemini 3 Flash的性能令人印象深刻,但在实际体验中,我们发现其在速度方面确实表现优异,但若论及任务的准确性,尤其是在处理复杂长链条思考和高难度任务时,与3 Pro相比仍有差距。例如,在要求Gemini 3 Flash编写一个“WebRTC纯前端投屏”的程序时,虽然程序能够运行,但功能却无法正常使用。多次尝试修改后,问题仍未得到解决。
而当我们把同样的任务交给3 Pro时,它很快就找到了问题的根源。
并且,3 Pro还顺手修改了代码,完成了任务。
由此可见,目前3 Flash的优势主要体现在速度和成本上。对于需要深度思考、处理复杂任务的场景,Pro版本仍然是更优的选择。然而,如果将其与市面上其他轻量级模型进行比较,3 Flash无疑具备了强大的竞争力。
在此时刻推出Gemini 3 Flash,谷歌显然并非仅凭模型能力取胜,而是意图借助其强大的生态系统优势,对竞争对手进行“围剿”。

可以预见,YouTube、Gmail、Google Maps等谷歌全家桶产品中,很快就会集成Gemini 3 Flash。面对如此强势的布局,OpenAI等竞争对手无疑承受着巨大的压力。
此前,Gemini 3的发布已使OpenAI内部拉响警报。上周,OpenAI的CEO Sam Altman曾表示,Gemini 3对公司业绩指标的影响并未超出预期,并计划在明年1月解除“红色警报”。然而,此次Gemini 3 Flash的突然登场,或许会让“红色警报”升级为“黑色警报”。
Gemini 3 Flash的问世,可能仅仅是谷歌战略的“开胃菜”。当AI像水电一样,廉价且普遍地融入谷歌的各项应用和平台时,单纯比拼模型参数的时代或将落幕。在构建强大的生态系统方面,留给OpenAI等竞争对手的时间,恐怕已不多了。




