今天,人工智能领域迎来一个重磅消息:OpenAI 低调发布了其最新的 AI 模型——GPT-4.5。这一举动不仅彰显了 OpenAI 在 AI 技术上的持续领先地位,也预示着 AI 技术即将进入一个更加智能化的新纪元。
据官方信息显示,GPT-4.5,内部代号为 “Orion”,是 OpenAI 迄今为止规模最大、算力最为强大的基座模型。 此次更新不仅在数据和算力规模上实现了突破,更重要的是,在模型性能和实际应用能力上有了质的飞跃。 目前,GPT-4.5 将优先提供给每月支付 200 美元的 ChatGPT Pro 用户,随后逐步向 ChatGPT Plus 订阅用户开放。 这一策略可能旨在收集早期用户的使用反馈,以便在更大范围内推广前进行优化。
与之前的模型相比,GPT-4.5 在扩展预训练和后训练方面实现了关键性进展。通过对无监督学习的深度运用,GPT-4.5 显著提升了识别模式、建立复杂联系和创造性生成内容的能力,且不再过度依赖复杂的推理过程。这意味着模型在处理模糊、非结构化信息时,能够更高效、更准确地理解用户意图。 值得注意的是,虽然 GPT-4.5 的计算效率相比 GPT-4提升了超过10倍,但是其API价格也同步上涨,每100万token输入的价格高达75美元,输出价格更是攀升至150美元。 尽管价格高昂,但考虑到其潜在的性能提升,依然引发了业界的广泛关注。
OpenAI 的 CEO 奥尔特曼虽然没有出席此次发布活动,但他通过社交媒体表达了对 GPT-4.5 的高度评价。 奥尔特曼称,与 GPT-4.5 的对话让他第一次体会到了与富有思想的人交流的感觉,并且能够从模型中获得真正具有价值的建议。 然而,他也坦诚地表示,GPT-4.5 是一个规模庞大且计算成本极高的模型,受到 GPU 计算资源短缺的影响,不得不推迟同时推出 Plus 和 Pro 版本的计划。 GPU 算力瓶颈一直是制约 AI 模型发展的重要因素,OpenAI 此举也反映了整个行业面临的共性挑战。
回顾 OpenAI 的发展历程,从 2018 年推出 GPT-1 到今天发布 GPT-4.5,OpenAI 在 AI 领域的探索已经持续了六年。在这期间,他们不断迭代,从 GPT-1 到 GPT-2,再到 GPT-3 和 GPT-3.5,每一次更新都带来了显著的性能提升。 而基于 GPT-3.5 的 ChatGPT 更是在全球范围内引发了 AI 聊天机器人的热潮,成为了 AI 应用的里程碑。如今,GPT-4.5 的发布无疑将再次刷新人们对 AI 技术能力的认知边界。
在核心能力提升方面,GPT-4.5 展现出了更加自然的交互方式、更广阔的知识覆盖和更高的情商。 它能够更好地理解用户的复杂意图,有效减少 “幻觉” 现象,并在写作、编程和解决实际问题等任务中表现出卓越的能力。 根据 OpenAI 公布的数据,在 SimpleQA 数据集测试中,GPT-4.5 的准确率高达 62.5%,而 “幻觉” 率则降低至 37.1%,这些数据均明显优于之前的模型。 这也表明,OpenAI 在提升 AI 模型的可靠性和真实性方面取得了显著进展。
在使用方式上,GPT-4.5 也引入了多项创新功能。ChatGPT Pro 用户可以立即在模型选择器中选用 GPT-4.5,而 Plus 和 Team 用户预计将在下周获得体验机会。 新版本支持通过搜索获取最新信息,文件和图像上传,以及使用画布处理写作和代码等功能,为用户提供更加便捷和高效的 AI 服务体验。 值得关注的是,由于模型体积庞大且计算密集,OpenAI 仍在评估 GPT-4.5 在 API 中长期提供的可行性。 这也暗示着,未来 GPT-4.5 的商业模式和应用场景可能存在多种可能性。
GPT-4.5 的发布不仅引发了业界的广泛关注,也激发了关于 AI 技术未来发展方向的深入讨论。 Box AI CEO Aaron Levie 表示,通过早期测试,他们发现 GPT-4.5 在处理复杂企业数据方面表现出色,这将在企业中开拓更多创新应用场景。 Cognition 联合创始人兼 CEO Scott Wu 也分享了使用 GPT-4.5 的体验,称其性能表现非常棒,并在智能体编码基准测试中实现了显著改进。 这些来自行业领袖的积极评价,进一步印证了 GPT-4.5 在实际应用中的潜力。
尽管 GPT-4.5 取得了诸多突破性进展,OpenAI 也明确表示,它目前仍处于无监督学习的前沿探索阶段,还不能完全替代之前的模型。 未来,OpenAI 将继续致力于 AI 技术的发展,为用户提供更智能、更便捷、更高效的 AI 服务,并探索 AI 技术在各行各业的创新应用。

值得注意的是,在 OpenAI 发布 GPT-4.5 的同时,国内的 AI 技术公司也在积极推进自身的技术创新。 月之暗面悄然公布了其最新的 Kimi-K1.6-IOI-high 模型,在 LiveCodeBench 基准测试榜单上荣登榜首。 而 DeepSeek 则持续引发关注,并发布了专为英伟达 Hopper GPU 打造的 MLA 解码内核 FlashMLA 等一系列开源技术。 这些成果的共同涌现,无疑将进一步加速 AI 技术的普及与应用,并推动整个 AI 行业的蓬勃发展。 这也表明,在全球 AI 竞赛中,中国力量正在崛起,并将与国际同行共同推动 AI 技术的进步。