科技
-
OpenAI未开源的GPT- OSS基础模型,他通过去除强化学习实现了逆转
Cornell Tech博士生Jack Morris成功逆转了OpenAI发布的gpt-oss-20b模型的强化学习,发布了基础模型gpt-oss-20b-base。该模型可用于生成任意文本,但已不再对齐,可能生成不当内容。Morris使用低秩适应(LoRA)方法对模型进行微调,以恢复其基础能力。模型地址:https://huggingface.co/jxm/gpt-oss-20b-base。
-
OpenAI和奥特曼将投资脑机接口公司,与马斯克的Neuralink展开竞争
OpenAI 和其联合创始人山姆・奥特曼正准备投资脑机接口公司 Merge Labs,与伊隆・马斯克的 Neuralink 竞争。Merge Labs 正以 8.5 亿美元的估值筹集新资金,预计大部分资金来自 OpenAI 的风险投资团队。奥特曼将与 Alex Blania 一起帮助启动该项目。这将加剧两位亿万富翁之间的竞争。
-
LLM过于复杂化简单任务,Karpathy:有些事不需要多想
大模型在深度思考模式下表现出越来越强的自主代理倾向,尤其在编码等任务中,即使简单操作也需冗长推理,导致效率低下。Andrej Karpathy 指出,这种现象源于对长周期任务优化的过度追求,建议提供更灵活的思考模式选项。
-
GPT-5问题频出,奥特曼团队全面回应,图表错误因过度疲劳
GPT-5 发布后遭遇广泛质疑,因其在数学、逻辑及编码任务中的表现不佳。OpenAI CEO Sam Altman 承认存在问题,并在 Reddit AMA 中回应用户反馈,部分恢复 GPT-4o 等早期模型的访问权限,同时承诺改善安全性和用户体验。
-
奥特曼发布GPT-5,人人免费体验“博士级”智能,但基准图错误引发网民吐槽
GPT-5 终于发布,集成多种功能,无需切换模型。其在数学、编程、视觉和健康领域表现出色,如 AIME 测试中无工具辅助达 94.6%。费用方面分为免费版、Plus 和 Pro 计划。尽管存在一些小问题,总体表现令人期待。
-
Agentic Web:互联网的未来新潮流
未来互联网将从「人读内容」转向「智能体执行任务」,用户通过自然语言向AI智能体发出目标,由AI自主规划、搜索、调用服务,最终完成复杂任务。这一变革将互联网从信息仓库转变为行动网络,智能体不仅能代表人类与系统交互,还能作为系统对人类的接口,实现「意图—执行」的闭环。
-
DeepSeek的GRPO会导致模型崩溃?看看Qwen3新范式GSPO的效果
Qwen团队提出了一种新的强化学习算法——组序列策略优化(GSPO),解决了DeepSeek的GRPO算法在逐token重要性采样中积累高方差和训练不稳定的问题,提升了大语言模型训练的稳定性和效率。
-
Grok 4晋级决赛,大模型对抗赛Gemini全军覆没,马斯克「装」起来了
Grok 4 在半决赛中击败 Gemini 2.5 Pro,晋级总决赛。尽管Grokk在比赛中表现混乱,最终通过加赛以和棋收场晋级。另一边,o3 以 4-0 战胜 o4-mini,顺利晋级决赛。总决赛将在 Grok 4 和 o3 之间展开。
-
首届大模型对抗赛:DeepSeek、Kimi首轮出局
谷歌近日举办了首届大模型国际象棋对抗赛,参赛者包括多个知名AI模型。首轮比赛结束后,Grok 4、Gemini 2.5 Pro、o4-mini 和 o3 均以 4-0 的战绩晋级半决赛,其中 Grok 4 表现最为出色,被视为夺冠热门。
-
阻击OpenAI,Claude抢先发布4.1版
Anthropic 发布的新模型 Claude Opus 4.1,在智能体任务、编程和推理能力上显著提升,具有 200K 上下文窗口。该模型已面向 Claude Pro、Max、Team 和 Enterprise 用户开放,并通过多个平台提供使用。尽管性能优越,但高昂的定价引起用户吐槽。