# OpenAI
-
DeepSeek的GRPO会导致模型崩溃?看看Qwen3新范式GSPO的效果
Qwen团队提出了一种新的强化学习算法——组序列策略优化(GSPO),解决了DeepSeek的GRPO算法在逐token重要性采样中积累高方差和训练不稳定的问题,提升了大语言模型训练的稳定性和效率。
-
Grok 4晋级决赛,大模型对抗赛Gemini全军覆没,马斯克「装」起来了
Grok 4 在半决赛中击败 Gemini 2.5 Pro,晋级总决赛。尽管Grokk在比赛中表现混乱,最终通过加赛以和棋收场晋级。另一边,o3 以 4-0 战胜 o4-mini,顺利晋级决赛。总决赛将在 Grok 4 和 o3 之间展开。
-
首届大模型对抗赛:DeepSeek、Kimi首轮出局
谷歌近日举办了首届大模型国际象棋对抗赛,参赛者包括多个知名AI模型。首轮比赛结束后,Grok 4、Gemini 2.5 Pro、o4-mini 和 o3 均以 4-0 的战绩晋级半决赛,其中 Grok 4 表现最为出色,被视为夺冠热门。
-
阻击OpenAI,Claude抢先发布4.1版
Anthropic 发布的新模型 Claude Opus 4.1,在智能体任务、编程和推理能力上显著提升,具有 200K 上下文窗口。该模型已面向 Claude Pro、Max、Team 和 Enterprise 用户开放,并通过多个平台提供使用。尽管性能优越,但高昂的定价引起用户吐槽。
-
OpenAI深夜再推两款推理模型,达o4-mini水平,适配笔记本与手机运行
OpenAI 开源了两个新的语言模型 gpt-oss-120b 和 gpt-oss-20b,具备强大的推理能力和高效的硬件适应性,支持宽松的 Apache 2.0 许可证,可自由构建和调整。这两款模型在编程、医疗和工具使用等多方面表现优秀,超越了同等规模的开源模型。
-
全球首个集成云端Agent团队的IDE亮相,项目级开发全程自动化
Replit 由于 AI 删库引发争议,但 AI 编程工具迭代迅速。本周,国内公司芸思智能推出 Vinsoo Code,实现云端多 Agent 安全并行运行,全面提升开发效率。该系统支持项目级开发,本地 IDE 与云端 Agent 协同作业,提供 Vibe Mode 和 Full Cycle Mode 两种模式,确保代码生成、测试调试、部署等全流程自动化。
-
Meta因挖人成瘾再遭员工批评:不积极宣传项目,开源生态或将进一步恶化
Meta 内部管理问题频出,朱泽园发推文表示在 Meta 花近一年才获准转推自己的项目,且转推效果不佳。他提到开源项目 Physics of Language Models 受关注不高,引发业内对开源价值的讨论。
-
OpenAI推出学习模式,AI教师时代来临
ChatGPT推出学习模式,通过交互式提示、支架式回复、个性化支持等功能,引导用户主动学习,帮助解决具体问题。该模式适用于免费用户,已获广泛好评。
-
DeepMind夺IMO金牌,科学家转投Meta,全是华人大牛
Meta 挖走多位 Google DeepMind IMO 金牌成员,包括 Tianhe Yu、Cosmo Du 和 Weiyue Wang,以重振 Llama 系列。此举引发 AI 领域人才大洗牌,Meta 和微软正积极从竞争对手挖角。
-
OpenAI计划建设5GW数据中心,马斯克公布5年AI基建计划
《华尔街日报》报道,OpenAI 和软银在“星际之门”项目上出现分歧,计划大幅缩减。尽管先前承诺投资 1000 亿美元,但目前仅计划在今年年底前建造一个小型数据中心。然而,OpenAI 宣布与甲骨文合作,将在美国开发 4.5 GW 的数据中心容量,加上德克萨斯州阿比林的 Stargate I 数据中心,总容量将超过 5 GW。