# OpenAI
-
GPT-5问题频出,奥特曼团队全面回应,图表错误因过度疲劳
GPT-5 发布后遭遇广泛质疑,因其在数学、逻辑及编码任务中的表现不佳。OpenAI CEO Sam Altman 承认存在问题,并在 Reddit AMA 中回应用户反馈,部分恢复 GPT-4o 等早期模型的访问权限,同时承诺改善安全性和用户体验。
-
奥特曼发布GPT-5,人人免费体验“博士级”智能,但基准图错误引发网民吐槽
GPT-5 终于发布,集成多种功能,无需切换模型。其在数学、编程、视觉和健康领域表现出色,如 AIME 测试中无工具辅助达 94.6%。费用方面分为免费版、Plus 和 Pro 计划。尽管存在一些小问题,总体表现令人期待。
-
OpenAI GPT-5发布:面向全用户开放,表现如人类专家
OpenAI发布GPT-5模型,性能强大,在编程、数学、写作、健康等领域表现出色,堪比人类专家。GPT-5已向所有用户逐步推出,付费用户享有更高使用额度。新模型采用智能高效模型、深度推理模型及实时路由器组成Uyuni系统,能处理复杂问题,减少错误,提升用户体验。
-
OpenAI Officially Releases GPT-5 Model: Open to All Users, More Human-like Expert
On August 8th, OpenAI officially unveiled GPT-5 during an early morning broadcast. This la…
-
DeepSeek的GRPO会导致模型崩溃?看看Qwen3新范式GSPO的效果
Qwen团队提出了一种新的强化学习算法——组序列策略优化(GSPO),解决了DeepSeek的GRPO算法在逐token重要性采样中积累高方差和训练不稳定的问题,提升了大语言模型训练的稳定性和效率。
-
Baidu’s New Reasoning Model Expected in Late August, Potentially Surpassing OpenAI’s o3 Full Version
According to media reports on August 7th, sources indicate that Baidu is expected to unvei…
-
Grok 4晋级决赛,大模型对抗赛Gemini全军覆没,马斯克「装」起来了
Grok 4 在半决赛中击败 Gemini 2.5 Pro,晋级总决赛。尽管Grokk在比赛中表现混乱,最终通过加赛以和棋收场晋级。另一边,o3 以 4-0 战胜 o4-mini,顺利晋级决赛。总决赛将在 Grok 4 和 o3 之间展开。
-
首届大模型对抗赛:DeepSeek、Kimi首轮出局
谷歌近日举办了首届大模型国际象棋对抗赛,参赛者包括多个知名AI模型。首轮比赛结束后,Grok 4、Gemini 2.5 Pro、o4-mini 和 o3 均以 4-0 的战绩晋级半决赛,其中 Grok 4 表现最为出色,被视为夺冠热门。
-
阻击OpenAI,Claude抢先发布4.1版
Anthropic 发布的新模型 Claude Opus 4.1,在智能体任务、编程和推理能力上显著提升,具有 200K 上下文窗口。该模型已面向 Claude Pro、Max、Team 和 Enterprise 用户开放,并通过多个平台提供使用。尽管性能优越,但高昂的定价引起用户吐槽。
-
OpenAI深夜再推两款推理模型,达o4-mini水平,适配笔记本与手机运行
OpenAI 开源了两个新的语言模型 gpt-oss-120b 和 gpt-oss-20b,具备强大的推理能力和高效的硬件适应性,支持宽松的 Apache 2.0 许可证,可自由构建和调整。这两款模型在编程、医疗和工具使用等多方面表现优秀,超越了同等规模的开源模型。