GPT-5更新,但缺少灵魂

GPT-5.1更新旨在解决用户反馈的“没人味”问题,并注重指令遵循和情感交互。然而,实际测试显示其指令遵循能力仍有不足,情感表现不如GPT-4o自然,甚至出现回答变“尬”的情况。最大的亮点是“自适应”功能,能根据题目难度调整思考时间,提升效率。此外,ChatGPT增加了回答风格设置,能提供更具个性化的交互体验,但部分风格略显生硬。整体而言,此次更新亮点有限,OpenAI面临日益激烈的市场竞争。

备受关注的GPT-5,似乎终于有所“进化”,不再是那个曾被用户吐槽“没味道”的AI了。

近日,OpenAI的CEO奥特曼再次为自家产品站台。与以往不同的是,这次重点不再是跑分和性能比拼,而是直面用户的反馈,倾听“群众的心声”,着力于产品的优化改进。

GPT-5更新,但“尬”味犹存?

可以看出,OpenAI正面临不小的压力。毕竟,GPT-4o上线后本应功成身退,却因其出色的表现广受欢迎,不得不继续“服役”。新产品口碑反不如旧产品,这无疑会让任何一家公司都急于证明自己的价值。

那么,被寄予厚望的GPT-5.1(文中代称为5.1,“替身”暗指其在GPT-4o光芒下的境遇),能否真正取代用户心中的“赛博白月光”呢?在仔细研读了官方的案例并亲自上手测试后,我们有了初步的答案。

总的来说,用三个字来形容:不太妙

GPT-5更新,但“尬”味犹存?

需要说明的是,以下的测试均在纯粹的临时聊天环境中进行,排除了AI记忆的干扰。

我们首先测试了奥特曼“特别强调”的指令遵循能力。在第一个问题上,5.1就显得有些吃力——明明要求回答六个字,结果却只给出了五个。而这个“六字游戏”甚至是官方案例中的一个。

GPT-5更新,但“尬”味犹存?

如此表现,不禁让人怀疑是否是中文输入导致的问题。于是,我们尝试使用官方提供的完全一致的英文提示词,结果5.1依旧未能给出正确的答案。

GPT-5更新,但“尬”味犹存?

不死心的我们,又换了一个更具挑战性的问题:写一段200字的“薯条颂”,但全文不能出现“的”字。答案表面上看起来似乎符合要求,但令人费解的是,回答的文字竟然变成了繁体。

GPT-5更新,但“尬”味犹存?

起初认为可能是网络波动导致,但经过五次尝试,结果都是繁体字。而当我们去除“全文不能出现‘的’字”这一强制性指令后,回答又恢复了正常。

GPT-5更新,但“尬”味犹存?

作为对比,我们再看看Gemini 2.5 Pro的表现。它轻松、准确地给出了符合所有要求的答案,没有任何拖泥带水。

GPT-5更新,但“尬”味犹存?

坦白讲,测试到这里,我们产生了深深的疑虑。虽然这只是一个小的版本更新,但官方宣传的几个卖点中,至少有三分之一的表现不尽如人意,这确实说不过去。

接下来是用户反馈中普遍吐槽的问题:GPT-5“没感情”。官方宣称,5.1版本在5的基础上,变得“更温暖、更有对话性”,能够在有趣和清晰有用之间找到平衡。然而,从官方展示的案例来看,效果只能算作一般。GPT-4o本身就具备的能力,在GPT-5中似乎有所丢失,现在又依靠5.1才“回到起跑线”,这确实难以称赞。

GPT-5更新,但“尬”味犹存?

尽管如此,我们还是进行了测试。当被问及一个经典的失恋问题时,对比之下,差距立显。无论是5.1还是5,在情感表达上都与4o不在一个水平线上。

上:GPT-5.1,中:GPT-5,下:GPT-4o

GPT-5更新,但“尬”味犹存?

可以明显感觉到,GPT-5和5.1在描述“失恋”时,更像是一个旁观者,在分析“失恋”是一种怎样的体验,为什么会难过,以及如何解决——这是一种对人类情感的刻板印象式解读。而GPT-4o的回答,则更像是已经设身处地,感同身受,能够第一时间给予共情和鼓励,无愧于“梦中情AI”的称号。

为了更全面地评估,我们再次尝试了其他问题。令人意外的是,这次新版本的回答似乎还不如老版本,连基本的情感表达都懒得施加了。

上:GPT-5,下:GPT-5.1

GPT-5更新,但“尬”味犹存?

再来看官网的更新公告,除了各种情感语气对比,还有一个“自适应耗时对比图”显得尤为突出。

“自适应”能力,我愿称之为5.1更新最大的亮点,毕竟前两个卖点都比较“拉胯”。

GPT-5更新,但“尬”味犹存?

这项优化简单来说,就是AI能够根据问题的难度,智能分配所需的思考时间。过去,无论是询问“杭州有哪些美食”还是“宇宙为何大爆炸”,AI投入的“精力”可能都是差不多的。

实际测试也印证了这一点。在处理简单的逻辑问题时,左侧显示5.1思考过程的图明显比右侧5的要快很多。

GPT-5更新,但“尬”味犹存?

而在面对复杂的编程难题时,5版本更快地给出了错误的答案,而5.1则投入了更长的思考时间,最终给出了正确的解决方案。

GPT-5更新,但“尬”味犹存?

虽然这项优化对于普通用户来说感知可能不那么明显,但对于调用API的用户而言,无疑是一大利好。在处理简单问题时可以节省成本,在复杂问题上也能避免因为AI“想太少”而产生的错误。

除了以上属于5.1版本的变动,ChatGPT本身也迎来了一个整体性的重大更新:在个性化设置中,用户现在可以为GPT选择不同的回答风格,除了默认模式外,还提供了七种预设的角色人设。

GPT-5更新,但“尬”味犹存?

这个功能相当有趣,同一个问题,在不同人设下会呈现出截然不同的回答风格,差异感非常明显。例如,“吐槽达人”的回答会更加直接和尖锐;“技术宅”则充满探索欲,喜欢用艺术化的语言表达;而“专业可靠”模式则更像一个纯粹的工具人,精准高效。

上:吐槽达人,中:技术宅,下:默认模式

GPT-5更新,但“尬”味犹存?

相较于默认模式,这些新的人设的确带有些许“”的味道。但神奇的是,当AI套上特定人设的外壳时,那种通常存在的“讨好感”竟然在一定程度上消失了。特别是“吐槽达人”,几乎凡事都针锋相对,反而展现出了一部分AI所缺乏的思辨能力。它对于那些“不给钱还想让AI卖力干活”的话术毫不买账,甚至能识别出用户在PUA它。

可以说,如果这些聊天方式能不那么“尬”,那么这种模式的潜力,或许会比默认模式大得多。

GPT-5更新,但“尬”味犹存?

总体而言,尽管这次更新中不乏亮点,但OpenAI所能带给用户的惊喜似乎越来越少。回想起产品首次问世时的惊艳,以及GPT-4o能够生图的强大功能,如今看来,GPT-5的出现,或许还不如不发布。

根据10月份的一份报告显示,GPT系列产品在2025年已经经历了近一年的下滑,市场份额持续萎缩。尽管凭借先发优势仍保住了龙头地位,但AI领域的竞争远未停止,且异常激烈。

Similarweb 10月统计数据

GPT-5更新,但“尬”味犹存?

就拿我个人来说,过去我最常使用的是GPT,但近来也开始频繁尝试其他厂商的产品。竞争对手的市场份额增长速度,比我们想象的要快得多,也顺利得多。

一边是奥特曼仍在全球各地“拉投资”,一边是核心产品质量逐渐趋于平庸。OpenAI,是时候拿出点真本事,给我们带来真正的惊喜了。

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行审核删除。
(0)
Rain科技Rain科技
上一篇 2025年 11月 14日 上午6:12
下一篇 2025年 11月 14日 上午7:13

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

欢迎来到AI快讯网,开启AI资讯新时代!