GPT-5.6首批实测曝光!精准对抗Mythos

大模型圈这个月彻底杀疯了。Anthropic刚刚甩出两枚重型武器——Claude Fable 5Mythos 5,直接引爆了6月的AI战场。另一边,OpenAI的GPT-5.6也同步被扒了个底朝天,代号、候选版本、实测体感全部流出。两家堪称“你递表我发模型”,贴身肉搏。但问题是:这一波,究竟谁能压谁一头?

GPT-5.6首批实测曝光!精准对抗Mythos

GPT-5.6浮出水面

截至目前,OpenAI对GPT-5.6还是零官宣,尚未正式发布。不过,海外不少网友已经对还没公开的「内部检查点」做了探针测试。

所谓检查点(checkpoint),就是模型在训练过程中某个时间点存下的一份参数快照。OpenAI内部会存很多份,横向比较,再从里面挑一个认为「够好、可以拿去发」的版本,这个版本就叫发布候选版(RC)。

从上周开始,OpenAI内部正在测两个新检查点,代号分别是kindle和kepler。其中kindle-alpha被选为发布候选版。

GPT-5.6首批实测曝光!精准对抗Mythos

从流出的体感来看,GPT-5.6这次最被反复提及的升级,是前端/UI生成。网友Pankaj Kumar的说法是,kindle-alpha的前端生成能力大幅提升,不需要复杂的提示词或额外技巧,就能直接产出更强的界面输出

GPT-5.6首批实测曝光!精准对抗Mythos

此外,它的视觉能力也很能打,在图像理解和图像引用类任务上表现不错,整体在推理、编码、UI生成上都有明显改善。这是网友Chris实测kindle的效果,使用medium档位:

GPT-5.6首批实测曝光!精准对抗Mythos

而这是另一位网友此前在非推理版本Joule上实测的效果:

GPT-5.6首批实测曝光!精准对抗Mythos

可以看出前者精美很多。但网友Leo拿同一个prompt、在xhigh档位上分别实测了kepler和kindle两个版本,发现kindle比起kepler,反而还退步了。

GPT-5.6首批实测曝光!精准对抗Mythos

嗯…这效果确实很难评。他甚至判断,OpenAI很可能还会继续打磨,不排除最后弃用kindle这个候选版。最新消息是,kindle已被移出Arena,出现了一个新模型Levi。有网友猜测Levi也可能是GPT-5.6内部版本的一个代号,并对比了它和GPT-5.5的前端能力:

【此处无法插入视频,遗憾……可到原出处查看~】

可以看出Levi的前端也挺能打的,风格清爽简约,富有高级感,细节处理也很到位。不过有网友调查后发现,Levi可能来自Meta,而非GPT-5.6。

GPT-5.6首批实测曝光!精准对抗Mythos

那么,GPT-5.6究竟能打过Mythos吗?网友mark_k声称,GPT-5.6「在多个agentic coding基准上击败Mythos」。

GPT-5.6首批实测曝光!精准对抗Mythos

但目前来看,更有说服力的是前面展示的网友Leo的实测。他认为GPT-5.6的情况不容乐观:

kindle相比kepler是退步。以它目前的形态,会被Mythos轻松击败

6月,上演御三家「速度与激情」

6月,夏天来了,大模型圈也是火热起来了。海外AI御三家的模型发布时间全撞在了一起:Fable 5、Gemini 3.5 Pro、GPT-5.6,上演了一出「生死时速」。而且打的是同一批能力——推理、智能体、编码、前端生成。

有意思的是,三家虽然都把节点压在6月,但到现在真正把卷子交上来的,只有A社一家。Gemini 3.5 Pro在5月19日的谷歌I/O大会上亮相,主打200万token上下文和Deep Think推理,但还未正式上线,官方定于6月正式可用。GPT-5.6,消息传出是本月晚些时候发布

这也给OpenAI的处境添了一层张力:对手已经把分数贴出来了,内部可能还在为该交哪一版RC纠结。

但除了跑分,定价也是一个重要因素。Fable 5和Mythos 5统一定价为每百万输入Token10美元、每百万输出Token50美元,约为现有Opus的两倍。如果GPT-5.6在能力上和Mythos打平甚至略输,但价格便宜得多,那它在真实采用率上还是有可能扳回一城的。

目前,OpenAI还未有任何官方公告,真正的对决要等GPT-5.6正式版和Fable正面跑分那一刻——这个月内大概率见分晓,敬请期待吧。


观察小结:
从当前泄露信息看,GPT-5.6内部版本仍不稳定,kindle候选版的表现甚至不如前代kepler,而Anthropic的Mythos 5已经以强推理、高定价的姿态落地。OpenAI面临的不仅是技术冲刺,更是发布策略的博弈——是仓促推出一款可能被碾压的模型,还是继续打磨直到万无一失?考虑到Sam Altman此前反复提及“GPT-5将是一个巨大的飞跃”,用户期望值已被拉高,如果最终版本只是“略微优于Opus”,恐怕难以服众。另一方面,谷歌的Gemini 3.5 Pro也虎视眈眈,这个6月注定不会平静。

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行审核删除。
(0)
Rain科技Rain科技
上一篇 6小时前
下一篇 5小时前

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

欢迎来到AI快讯网,开启AI资讯新时代!