OpenAI 近日震撼发布了其最新大型语言模型 GPT-4.5,并通过直播活动正式亮相。这款模型被誉为 OpenAI 在人工智能对话技术领域的一项重大突破,并将分阶段向付费用户开放试用,预示着 AI 对话技术进入一个全新时代。与其前代产品相比,GPT-4.5 不仅在规模上有所扩展,更在性能和效率上实现了显著提升。
根据 OpenAI 的计划,不同层级的付费用户将分批体验 GPT-4.5。ChatGPT Pro 用户将率先获得体验资格,立即可以在网页端、手机端和桌面端使用。之后,Plus 和 Team 用户预计将在下周迎来 GPT-4.5 的接入。而企业和教育用户则需要稍作等待。这种分阶段开放的策略旨在确保用户能够有序地体验和适应这一前沿科技。
GPT-4.5 作为 OpenAI 迄今为止规模最大的聊天模型,其计算效率较 GPT-4 提升超过 10 倍。这意味着模型在处理复杂任务时将更为高效。科技评论员奥特曼在社交媒体上表示,GPT-4.5 让他体验到了与“有思想的人”交谈的感受,并认为从模型中获得的建议极具价值。这种主观评价也侧面反映了 GPT-4.5 在理解人类意图和生成高质量回复方面的进步。
但 GPT-4.5 的强大性能是有代价的。由于模型规模庞大,计算成本高昂,其 API 价格高达 75 美元/百万 tokens 输入和 150 美元/百万 tokens 输出,是 GPT-4o 的 30 倍。OpenAI 表示正在评估是否长期在 API 中提供 GPT-4.5 服务,以确保资源的可持续利用。高昂的 API 价格可能限制小型开发者和研究人员的使用,但对于需要处理大规模、复杂任务的企业用户而言,其性能优势或许能够抵消成本劣势。
在 SimpleQA 基准测试中,GPT-4.5 的准确率达到 62.5%,幻觉率降至 37.1%,超越了先前的模型。这表明 GPT-4.5 在真实性方面有了显著提升。 改进写作、编程和解决实际问题等领域,GPT-4.5 显示出了巨大的潜力。虽然在数学推理方面略逊于 o3-mini 等专业推理模型,但整体性能的提升无疑为人工智能领域树立了新的标杆。模型的进步不仅在于对人类意图的更深层次理解,还在于其更加自然流畅的响应方式。客观来看,幻觉率的降低是衡量语言模型可靠性的重要指标, GPT-4.5 在这方面的进步值得肯定。


值得注意的是,作为 OpenAI 最后一个“非思维链模型”, GPT-4.5 通过扩大预训练和后训练规模,显著提升了非监督学习能力。 这为未来推理模型的发展奠定了基础,预示着人工智能领域将迎来更加广阔的应用前景 。 这种非监督学习能力的提升,意味着 GPT-4.5 在处理新信息和未知领域时可能具有更强的适应性和泛化能力。
目前,GPT-4.5 的功能主要集中在搜索、上传文件和图片以及画布操作上,暂不支持语音模式、视频和屏幕共享等多模态功能。不过,OpenAI 已经明确表示将持续更新和完善该模型,以满足用户不断增长的需求。多模态功能的缺失可能限制了其在某些场景下的应用,但 OpenAI 积极的更新计划表明,未来的 GPT-4.5 有望成为更加全面的 AI 解决方案。