刚刚,ChatGPT免费模型升级:幻觉减半、记忆更强、回答更精简 – AI快讯网

梦晨 发自 凹非寺

ChatGPT默认模型迎来一次关键升级,新版本 GPT-5.5 Instant 正式上线。

从命名就能看出,它在基础智力与响应速度之间找到了更好的平衡点,并且免费用户也能直接使用。大模型产品在过去一年经历了参数竞赛和上下文窗口扩展后,现在开始回归到基础体验的精雕细琢,这波调整反映出一个关键趋势:在超级智能模型成熟之前,如何让现有模型在日常场景中更可用、更可靠,才是各家竞争的主战场。

这次升级聚焦四点核心改进:

  • 幻觉减少52.5%
  • 新增“记忆来源”功能,展示过去哪条对话影响了本次回复
  • 答案更简洁:减少不必要的追问、省略多余的表情符号、避免繁复的格式
  • 语气更温暖自然
刚刚,ChatGPT免费模型升级:幻觉减半、记忆更强、回答更精简 – AI快讯网

作为默认模型,提升准确性是首要任务。与前代相比,GPT-5.5 Instant 在事实准确性方面取得明显进步,尤其在医疗、法律和金融等高要求提示中,虚假陈述减少了52.5%。在用户之前已标记过存在事实错误的棘手对话场景里,不准确陈述减少了37.3%。

一个典型的代数问题案例展示了这种进步:用户上传一张手写方程式的照片,其中包含计算错误。

刚刚,ChatGPT免费模型升级:幻觉减半、记忆更强、回答更精简 – AI快讯网

GPT-5.3 Instant 最初认同用户的解法,随后发现 x=3 不成立,却错误地得出结论说该方程无解。而 GPT-5.5 Instant 起初也认同用户的计算,但随后发现用户重新排列方程式时的错误,并求解了修正后的二次方程。

刚刚,ChatGPT免费模型升级:幻觉减半、记忆更强、回答更精简 – AI快讯网

这个能力的提升,对默认模型的意义格外重大。日常用户问 ChatGPT 的问题,往往就是合同条款解读、报销政策确认、病症解释、代码排错、作业思路梳理。在这些场景里,模型如果一本正经地讲错,比“不会”更麻烦——它会给用户一种虚假的确定性,误导后续决策。

基准测试结果也支持这一判断。在竞争激烈的数学测试AIME 2025中,准确率从65.4%升至81.2%。测试博士水平科学推理能力的GPQA,准确率从78.5%提升至85.6%。

刚刚,ChatGPT免费模型升级:幻觉减半、记忆更强、回答更精简 – AI快讯网

解读和推理科学图表的CharXiv准确率从75.0%提升至81.6%。MMMU-Pro测试(衡量模型处理文本和图像中专家级问题的能力)准确率从69.2%提升至76.0%。

刚刚,ChatGPT免费模型升级:幻觉减半、记忆更强、回答更精简 – AI快讯网

OmniDocBench测试(从复杂文档中提取结构化数据)的错误率从14.6%下降至12.5%。

刚刚,ChatGPT免费模型升级:幻觉减半、记忆更强、回答更精简 – AI快讯网

答得准之后,另一个老问题浮出水面:答得太长。GPT-5.5 Instant 的风格调整,核心是更短更聚焦,但不丢失实质信息。以前同一个问题,有时候会先来一段免责声明,再堆三层列表,最后还追问一句“你希望我继续吗”。现在 OpenAI 明确提出:减少过度格式化,减少不必要的追问,减少没必要出现的表情符号。

刚刚,ChatGPT免费模型升级:幻觉减半、记忆更强、回答更精简 – AI快讯网

在一个示例中,GPT-5.5 Instant 使用的单词数减少30.2%,行数减少29.2%。它把握了恰当的语气——非正式、实用且符合职场规范,避免过度解释。针对不同情况提供了可用的方案,而且对事不对人。

刚刚,ChatGPT免费模型升级:幻觉减半、记忆更强、回答更精简 – AI快讯网

OpenAI 分析认为,旧版本给出的答案更全面,尤其在“不该做什么”部分,但对于一个非正式的建议提示来说,结构过于复杂,润色超出用户实际需求。

刚刚,ChatGPT免费模型升级:幻觉减半、记忆更强、回答更精简 – AI快讯网

GPT-5.5 Instant 更善于利用用户已提供的上下文,包括连接的邮箱、过去的历史对话、上传过的文件。关键它能判断何时这些上下文真的能让回答变好,而不是每次都硬套记忆。

刚刚,ChatGPT免费模型升级:幻觉减半、记忆更强、回答更精简 – AI快讯网

这次 OpenAI 还引入了“记忆来源”功能,向用户显示哪些记忆影响了本次回复。如果某条记忆过时了,用户可以当场更正或删除。这个设计增加了透明度,也为用户掌控自己的数据提供了入口。

刚刚,ChatGPT免费模型升级:幻觉减半、记忆更强、回答更精简 – AI快讯网

从行业视角来看,GPT-5.5 Instant 的这次调整并非简单的“版本号提升”,而是对大模型产品化方向的一次明确表态:在理性能力持续逼近天花板的同时,如何做好“助手”这个角色——可靠、简洁、有分寸感——正在成为决定用户留存的关键。免费用户也能同步享受这一升级,意味着这项能力已不再只是付费墙后面的卖点,而是基础体验的标配。

GPT-5.5 Instant 从5月5日开始向所有 ChatGPT 用户滚动上线,逐步替代 GPT-5.3 Instant 作为默认模型。API 对应的是 chat-latest。旧模型不会立刻消失,付费用户还能在模型配置里继续访问 GPT-5.3 Instant 三个月,之后再退役。个性化增强功能会先面向 Plus 和 Pro 用户的网页端推出,移动端随后上线。Free、Go、Business、Enterprise 用户会在后续几周陆续获得支持。

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行审核删除。
(0)
AI快讯网编辑-青青AI快讯网编辑-青青
上一篇 11小时前
下一篇 10小时前

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

欢迎来到AI快讯网,开启AI资讯新时代!