当大语言模型的触角伸向理论数学的圣殿,一场静默的范式革命已然开始。布鲁塞尔自由大学(VUB)近期披露的研究成果,很可能成为一个历史性注脚:商用大模型已展现出独立生成原创数学证明的能力。
实验表明,OpenAI开发的ChatGPT-5.2(Thinking版本)成功解决了一个由数学家Ran和Teng在2024年提出的、悬置已久的数学猜想。这并非简单的数据拟合或已知证明的复现,而是一次具备原创性的逻辑建构。

图源注:本图片为AI生成,由AI生成服务Midjourney提供
这一突破标志着一个关键转折:大语言模型的能力边界正从代码辅助、文本创作,正式拓展至逻辑严密性要求极致的基础科学腹地。数学界反应强烈,许多研究者认为,这并非单纯的工具效率提升,而预示着科学发现范式的结构性变化——人类与机器在认知层面的协作关系进入新阶段。
“氛围证明”登场:从对话中孕育出的数学定理
研究团队将这一新模式命名为“氛围证明”,其灵感来源于近期引发关注的“氛围编程”。在整个证明过程中,ChatGPT独立探索证明路径,构建核心逻辑框架,展现了超越数据组合的原始推理能力。
完整证明历经7轮对话交互与4个版本的自我迭代,最终形成严谨的逻辑论证。尽管人类研究者仍承担了最终的验证工作,但AI的推演效率已远超人类数学家的预期。这揭示了一种新的可能性:AI可以充当“首席探索者”,在浩瀚的逻辑可能性空间中高效导航,而人类则扮演“首席架构师”与“终审法官”的角色。
产业焦点迁移:人类从“生产者”转向“验证者”
VUB的Vincent Ginis教授指出,这项成就打破了长期存在的“AI仅有归纳能力而无创造力”的偏见。随着AI生成数学证明的门槛降低,理论数学的研究节奏有望迎来数量级的提升。
更深层的影响在于学术生态的重塑。当机器能够自主产生大量具备潜力的证明思路和引理时,人类研究者的核心职能将不可避免地从重复性推导,转向更高层级的想象力引导、问题提出与成果甄别。数学研究的“劳动力密集型”色彩或将减弱,创意与批判性思维的权重则会空前增加。
客观视角:突破与局限并存
必须冷静看待的是,此次证明的猜想本身属于近年提出,其复杂性和历史地位与那些困扰数学界数个世纪的未解之谜仍有距离。AI的“创造力”目前仍需在人类设定的明确问题框架内激发,其探索方向仍深度依赖于训练数据与交互引导。
然而,它的象征意义毋庸置疑。它证明了基于统计模式训练的大模型,确实能产生符合严格演绎逻辑的成果,这为AI辅助甚至主导形式科学(如数学、逻辑学)的探索打开了新的想象空间。未来的竞争不仅在于模型规模,更在于其与形式化验证工具的深度融合,以及能否处理更具模糊性和开放性的原始问题。科学发现的“双引擎”时代,或许正以此为起点。