在人工智能技术迭代进入深水区之际,模型能力的每一次跃升都牵动着整个科技界的神经。随着各大厂商相继推出下一代架构,关于“通用人工智能”(AGI)的讨论已从理论走向实战预备阶段。此时流传出的任何关于头部模型的内幕消息,无疑都会被市场放大解读。以下是一份基于行业动态与供应链信息的深度梳理,旨在还原技术竞赛背后的真实逻辑。
彻底奔着 AGI 去的模型
Jay 发自 凹非寺
AI 前沿观察
OpenAI 近期的信息泄露状况,简直可以用“筛子”来形容。关于最新代号为「Spud」(土豆)模型的消息,又一次成为了焦点。
这颗「土豆」,就是万众瞩目的 GPT-6。
据多方爆料,这颗「土豆」已经彻底煮熟了,预计发布日期锁定在 4 月 14 号。
知情人士表示,这是个彻底奔着 AGI 去的模型——
性能暴涨 40%,在代码、推理、智能体任务上,全方位碾压前代版本。
原生多模态,一套架构搞定文本、音频、图像、视频。
更有着2M的超大上下文窗口。
它的终极形态更为关键——
GPT-6 将化身为一个超级引擎,负责把聊天、代码编程和浏览器功能彻底熔炼,融合成一个统一的智能体。
没错,就是外界念叨了很久的那个桌面级「超级应用」。
而最抓眼球的还是内部对这个模型的定位。
内部员工的说法是:
这是 AGI 的「最后一公里」,他们要砍光一切来赌。
替大家带来大量内幕消息的事自草莓哥@iruletheworldmo。
这老哥是有点实力在身上的,龙虾之父 Peter、Gavin Baker、Jim Fan 等大佬都是他的𝕏粉丝。
草莓哥兴奋地表示,最近内部简直漏风漏得像筛子,他从中搞到了不少猛料。
首先,砍掉一切旁支的原因,就是为了把所有资源全部倾注给新模型。
管理层在此前采访中表示,迈向 AGI 的进度已经完成了差不多80%。
而在内部员工看来,新一代模型,就是剩下的那 20%。
怎么说?拿数据说话~
一个原生多模态模型,却依然实现了基准测试的全面飞跃。
在代码、推理、智能体任务上,据说比前代强了40%。
上下文窗口也达到了惊人的 200 万 Token,是竞品版本的两倍。
定价方面,也延续了「优良传统」,每百万 Token 输入 2.5 美元,输出 12 美元,基本没比前代贵多少。
如果拿竞品来对标,那就是拥有 Mythos(神话)级别的智能,却只收 Sonnet 级别的定价。
据说,预训练在 3 月 17 号就已经完成了,后训练和安全工作也都搞定,随时可以上线。
粗布内定的发布日期是4 月 14 日。
随着风声走漏,关于更多内部细节也露了出来。
从 2025 年 12 月开始,内部就一直处于「编程红色警报」状态。
最近管理层亲自在播客上承认了,之前光顾着刷榜单,结果在编程领域被竞争对手狠狠摆了一道,大量用户被抢走。
Claude Code、Cowork 这类基于 AI 编程产品的爆火,让团队猛然意识到「原来只靠文本,真的有可能通往 AGI」。
这逼得决策层走投无路,不得不咬牙砍掉了几乎所有非核心产品线。
被砍掉的最重要项目,当属高开疯走又突然落幕的视频生成模型,这也间接导致和迪士尼(传得沸沸扬扬)的十亿美元合同彻底没戏。
然而这还不是全部。
新消息是,决策层现在演都不演了,一门心思扑在数据中心上,安全问题啥的以后再说!
目前,安全团队被划归到CRO(首席风险官)下面。
同时,负责产品的部门名称换成了AGI Deployment(AGI 部署部),足见野心。
一番大动作下来,终于憋出了一个(或许)足以回应竞争对手的大杀器。
不过评论区也有人提醒,这一爆料,并不一定十分准确。
不过,也有人出来站台,说虽然具体信息存疑,但大方向应该是对的。
新一代模型到底啥时候来还没个准信,但图像生成模型 2.0,是真的要来了。
毕竟已经昨日在 Arena 短暂出现过,一亮相就引起一阵不小的骚动。
为啥?看看下面这些图你就知道了——
朋友们,我没贴错图片,也不是摸鱼在玩《我的世界》。
这玩意儿……真就是网友用模型生成出来的。
基本上啥游戏都能 1:1 复刻,完全没有 AI 那种模糊感,根本分不清真假了。
还有这张操作系统桌面,我看到时都愣了半天,寻思这人干嘛要放张截图上来。
然后才反应过来,哦,这是人家拿新模型生成的。
如果提示词清晰一点,新模型可以直接夺舍视频网站首页。
世界认知能力也大幅提升,彻底和高端竞品对齐。
审美也蛮不错,不是一般生图模型固有的亮蓝色科幻风 AI 色调。
画人体结构图,效果看上去就像教科书里的插图一样。
真实感也大幅提升。
终于,那个丑陋的黄色滤镜没了,色彩看上去正常了很多。
期待上了,如果表现真的这么稳定,这无疑将成为迄今为止最实用的生图模型。
可惜,这款模型昨天已经从测试区下架,暂时测试不了。
说一千道一万,AI 竞赛走到今天,所有的模型背后都直指一个东西——算力。
而且它的重要性已彻底显化了。
最近发生的一系列事件,背后都隐隐有算力的影子。
竞争对手停止为部分订阅用户提供授权渠道,除了是为自家新模型提前铺路,另一方面,恐怕也是无奈之举——
真的撑不住了。
竞争对手估计也没想到,这玩意儿需求量这么大。
最近 Token 耗这么快可能也是这个原因,搞得大家都 Token 焦虑了。
而如今,视频项目被砍,商业合同被撕,也都是为了给新模型的算力需求让路做出的无奈之举。
去年,大家谈论数据中心时,好像还是个和生态环保一样,听上去很遥远的问题。
而现在,基础设施的冲击波,已经顺着产业链条,传导到了应用端。
这场比赛,真的越来越精彩了。
在算力稀缺的限制条件下,即便像奥特曼这样会融资的 CEO,也没法留后路。
拼的,就是谁敢孤注一掷,赌对那唯一的、通往未来的方向。
纵观整个行业动态,此类高强度爆料频发,折射出的是市场对技术突破的极度渴求与焦虑。从工程落地角度看,2M 上下文与原生多模态确实是当前架构演进的主流方向,但“性能暴涨 40%”这类量化指标在未经过第三方基准测试前,仍需保持审慎态度。此外,将安全团队划归风险官管理而非独立部门,这一组织架构调整若属实,确实暗示了企业在“速度”与“安全”天平上的最新权重选择。
对于开发者与终端用户而言,无论模型代号如何更迭,核心关注点应始终落在实际应用场景的效能提升上。算力瓶颈虽是客观存在,但优化算法效率与推理成本同样是破局关键。未来的竞争格局,或许不再单纯取决于参数量的大小,而在于谁能更高效地将智能转化为生产力。在这场豪赌中,唯有真正解决实际问题的技术,才能穿越周期,成为行业的基石。