# OpenAI
-
港大联合月之暗面发布OpenCUA:打造个性化电脑智能体
OpenCUA是一个全面开源框架,用于构建和扩展计算机使用智能体(CUA)。框架包括跨平台注释工具AgentNet Tool,涵盖3个操作系统和200多个应用/网站的大规模数据集AgentNet,以及将演示转化为「状态-动作」对的工作流程。基于此,团队构建了OpenCUA-32B模型,在OSWorld-Verified基准上达到34.8%的成功率,创下了开源SOTA。
-
马斯克诉苹果,DeepSeek打了脸
马斯克公开指责苹果偏袒OpenAI,涉嫌垄断应用商店排名,并威胁起诉。然而,网友用中国AI应用DeepSeek曾登顶应用商店榜首的事实“打脸”了马斯克。与此同时,马斯克自己的Grok机器人也表示,其老板关于苹果垄断的指控站不住脚,并承认马斯克曾操纵X平台算法。媒体还披露了马斯克与OpenAI CEO奥特曼的恩怨以及马斯克与苹果过往的不愉快经历。最后,Grok在应用商店排名上升,马斯克暂时停止了对苹果的法律行动。
-
OpenAI未开源的GPT- OSS基础模型,他通过去除强化学习实现了逆转
Cornell Tech博士生Jack Morris成功逆转了OpenAI发布的gpt-oss-20b模型的强化学习,发布了基础模型gpt-oss-20b-base。该模型可用于生成任意文本,但已不再对齐,可能生成不当内容。Morris使用低秩适应(LoRA)方法对模型进行微调,以恢复其基础能力。模型地址:https://huggingface.co/jxm/gpt-oss-20b-base。
-
OpenAI和奥特曼将投资脑机接口公司,与马斯克的Neuralink展开竞争
OpenAI 和其联合创始人山姆・奥特曼正准备投资脑机接口公司 Merge Labs,与伊隆・马斯克的 Neuralink 竞争。Merge Labs 正以 8.5 亿美元的估值筹集新资金,预计大部分资金来自 OpenAI 的风险投资团队。奥特曼将与 Alex Blania 一起帮助启动该项目。这将加剧两位亿万富翁之间的竞争。
-
LLM过于复杂化简单任务,Karpathy:有些事不需要多想
大模型在深度思考模式下表现出越来越强的自主代理倾向,尤其在编码等任务中,即使简单操作也需冗长推理,导致效率低下。Andrej Karpathy 指出,这种现象源于对长周期任务优化的过度追求,建议提供更灵活的思考模式选项。
-
GPT-5问题频出,奥特曼团队全面回应,图表错误因过度疲劳
GPT-5 发布后遭遇广泛质疑,因其在数学、逻辑及编码任务中的表现不佳。OpenAI CEO Sam Altman 承认存在问题,并在 Reddit AMA 中回应用户反馈,部分恢复 GPT-4o 等早期模型的访问权限,同时承诺改善安全性和用户体验。
-
奥特曼发布GPT-5,人人免费体验“博士级”智能,但基准图错误引发网民吐槽
GPT-5 终于发布,集成多种功能,无需切换模型。其在数学、编程、视觉和健康领域表现出色,如 AIME 测试中无工具辅助达 94.6%。费用方面分为免费版、Plus 和 Pro 计划。尽管存在一些小问题,总体表现令人期待。
-
OpenAI GPT-5发布:面向全用户开放,表现如人类专家
OpenAI发布GPT-5模型,性能强大,在编程、数学、写作、健康等领域表现出色,堪比人类专家。GPT-5已向所有用户逐步推出,付费用户享有更高使用额度。新模型采用智能高效模型、深度推理模型及实时路由器组成Uyuni系统,能处理复杂问题,减少错误,提升用户体验。
-
DeepSeek的GRPO会导致模型崩溃?看看Qwen3新范式GSPO的效果
Qwen团队提出了一种新的强化学习算法——组序列策略优化(GSPO),解决了DeepSeek的GRPO算法在逐token重要性采样中积累高方差和训练不稳定的问题,提升了大语言模型训练的稳定性和效率。
-
Grok 4晋级决赛,大模型对抗赛Gemini全军覆没,马斯克「装」起来了
Grok 4 在半决赛中击败 Gemini 2.5 Pro,晋级总决赛。尽管Grokk在比赛中表现混乱,最终通过加赛以和棋收场晋级。另一边,o3 以 4-0 战胜 o4-mini,顺利晋级决赛。总决赛将在 Grok 4 和 o3 之间展开。