# OpenAI
-
FlashAttention-4震撼发布,原生适配Blackwell GPU,英伟达护城河再加深
在 Hot Chips 2025 上,TogetherAI 首席科学家 Tri Dao 发布了 FlashAttention-4。该版本在 Backwell GPU 上比英伟达 cuDNN 库快 22%,采用两项算法改进:在线 softmax 算法和指数的软件模拟。此外,FlashAttention-4 使用 CUTLASS CuTe Python DSL,移植到 ROCm HIP 更具挑战性。Tri Dao 的多数核代码开源给英伟达开发者,助力英伟达 GPU 生态系统。 FLASHAttention 的 GitHub 软件库已获得了 1.91 万星,但 FlashAttention-4 的技术报告尚未发布。
-
当AI超越人类智慧:李飞飞与Hinton的对立生存指南
人类对AI安全的担忧由来已久,从阿西莫夫的“机器人学三定律”到近期OpenAI和Anthropic模型的“威胁”行为。李飞飞认为AI的安全性取决于设计、治理和价值观,而Hinton则担忧超级智能可能在未来5到20年内出现并失控。两人在AI安全问题上的观点截然不同,但都强调了人类在其中的关键角色。
-
港大联合月之暗面发布OpenCUA:打造个性化电脑智能体
OpenCUA是一个全面开源框架,用于构建和扩展计算机使用智能体(CUA)。框架包括跨平台注释工具AgentNet Tool,涵盖3个操作系统和200多个应用/网站的大规模数据集AgentNet,以及将演示转化为「状态-动作」对的工作流程。基于此,团队构建了OpenCUA-32B模型,在OSWorld-Verified基准上达到34.8%的成功率,创下了开源SOTA。
-
马斯克诉苹果,DeepSeek打了脸
马斯克公开指责苹果偏袒OpenAI,涉嫌垄断应用商店排名,并威胁起诉。然而,网友用中国AI应用DeepSeek曾登顶应用商店榜首的事实“打脸”了马斯克。与此同时,马斯克自己的Grok机器人也表示,其老板关于苹果垄断的指控站不住脚,并承认马斯克曾操纵X平台算法。媒体还披露了马斯克与OpenAI CEO奥特曼的恩怨以及马斯克与苹果过往的不愉快经历。最后,Grok在应用商店排名上升,马斯克暂时停止了对苹果的法律行动。
-
OpenAI未开源的GPT- OSS基础模型,他通过去除强化学习实现了逆转
Cornell Tech博士生Jack Morris成功逆转了OpenAI发布的gpt-oss-20b模型的强化学习,发布了基础模型gpt-oss-20b-base。该模型可用于生成任意文本,但已不再对齐,可能生成不当内容。Morris使用低秩适应(LoRA)方法对模型进行微调,以恢复其基础能力。模型地址:https://huggingface.co/jxm/gpt-oss-20b-base。
-
OpenAI和奥特曼将投资脑机接口公司,与马斯克的Neuralink展开竞争
OpenAI 和其联合创始人山姆・奥特曼正准备投资脑机接口公司 Merge Labs,与伊隆・马斯克的 Neuralink 竞争。Merge Labs 正以 8.5 亿美元的估值筹集新资金,预计大部分资金来自 OpenAI 的风险投资团队。奥特曼将与 Alex Blania 一起帮助启动该项目。这将加剧两位亿万富翁之间的竞争。
-
LLM过于复杂化简单任务,Karpathy:有些事不需要多想
大模型在深度思考模式下表现出越来越强的自主代理倾向,尤其在编码等任务中,即使简单操作也需冗长推理,导致效率低下。Andrej Karpathy 指出,这种现象源于对长周期任务优化的过度追求,建议提供更灵活的思考模式选项。
-
GPT-5问题频出,奥特曼团队全面回应,图表错误因过度疲劳
GPT-5 发布后遭遇广泛质疑,因其在数学、逻辑及编码任务中的表现不佳。OpenAI CEO Sam Altman 承认存在问题,并在 Reddit AMA 中回应用户反馈,部分恢复 GPT-4o 等早期模型的访问权限,同时承诺改善安全性和用户体验。
-
奥特曼发布GPT-5,人人免费体验“博士级”智能,但基准图错误引发网民吐槽
GPT-5 终于发布,集成多种功能,无需切换模型。其在数学、编程、视觉和健康领域表现出色,如 AIME 测试中无工具辅助达 94.6%。费用方面分为免费版、Plus 和 Pro 计划。尽管存在一些小问题,总体表现令人期待。
-
OpenAI GPT-5发布:面向全用户开放,表现如人类专家
OpenAI发布GPT-5模型,性能强大,在编程、数学、写作、健康等领域表现出色,堪比人类专家。GPT-5已向所有用户逐步推出,付费用户享有更高使用额度。新模型采用智能高效模型、深度推理模型及实时路由器组成Uyuni系统,能处理复杂问题,减少错误,提升用户体验。