十年论文终封神:零博士组合斩获ICLR时间检验奖——两位GPT天才本科生与二本逆袭的LeCun弟子

ICLR 2026时间检验奖揭晓,获奖论文DCGAN(Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks)正式封神,三位作者清一色非博士学历——这在整个顶级学术会议历史上极为罕见。十年来,这篇论文引用量突破2万次,不仅奠定了图像生成领域的工程基础,其核心思想更间接影响了后续GPT系列模型的自监督学习范式。更值得关注的是,三位作者如今兜兜转转,最终齐聚前OpenAI CTO Mira Murati创办的Thinking Machines Lab,形成一段“老友重聚”的技术传奇。

发自 凹非寺

ICLR 2026时间检验奖新鲜出炉,获奖者——

GPT天才本科生Alec Radford

Alec Radford照片

网友们纷纷送来祝贺:“实至名归!”

网友评论截图

Alec为人相当低调,其社媒清一水的都是转发推荐他人优秀成果。

但实则他在OpenAI里是和Ilya齐名的技术大神,也是初代GPT系列奠基者

奥特曼曾称他为爱因斯坦级别的天才,OpenAI总裁更是直言:

只要他想要的,我们都给。

Sam Altman评价截图

如今,这篇他在十年前一作发表的DCGAN论文,终于正式封神!

引用量超2w,是机器学习领域最具影响力的论文之一,也是公认的GAN工程应用开山之作。

而这篇论文之所以引人注目,还有另一层原因:

三位作者,没有一个是博士生

u1s1,这真的很酷!

DCGAN论文截图

时间检验奖首次颁给本科生

出乎意料的是,本届ICLR一口气开出个双黄蛋,两个时间检验奖分别是DCGANDDPG

前者直接影响了GPT系列模型的核心逻辑,后者则来自谷歌DeepMind,证明了深度强化学习可以应用于连续控制。

获奖名单

这也是ICLR连续三年都在以时间检验奖的形式认可机器学习成果,也足见这两篇论文的经典程度不分伯仲。

组委会是这样评价DCGAN这篇论文的:

这篇俗称DCGAN的论文,首次成功验证了基于学习的生成模型能够生成多样化、真实且结构复杂的图像。

该研究成果正式开创了图像生成子领域,如今图像生成已是机器学习领域最热门的研究方向之一,同时在工业领域落地了大量成熟且成效显著的应用。

尽管相关技术不断迭代升级(从生成对抗网络逐步发展至扩散模型),但DCGAN依旧历久弥新,是奠定这一重要研究领域的关键里程碑。

本论文共有三位作者,2个本科1个硕士

Alec Radford头像

其中,Alec Radford本科毕业于富兰克林·欧林工程学院(Franklin W. Olin College of Engineering)

据网友介绍,这是一所规模不大但实力不容小觑的工程院校。

通常只有400名学生,知名度虽不及哈佛、MIT等同类科技学校,但它们的学生在项目方向上个人自由度高,学校学术能力媲美常春藤名校。

欧林工程学院

在那里,他和同学们一起创立了公司Indico,并随后加入OpenAI,一干就是八年。

他是最早期GPT系列论文的核心贡献者,几乎参与了OpenAI所有的重大突破,也是多模态模型CLIP的主导者。

他所提出的Transformer架构加生成式预训练的方法,直接奠定了后续ChatGPT和其它大模型的基础,同时也在GPT-1到GPT-3、Whisper、DALL-E的研发中担任关键角色。

截止目前,Alec Radford的论文总被引数已超35万

Alec Radford被引截图

但在2024年底,Alec正式宣布告别老东家,转而追求独立研究。在去年3月,他以顾问的方式加入了前OpenAI CTO Mira Murati创立的Thinking Machines Lab

和他同期进新公司的,还有前OpenAI首席研究员Bob McGrew。

Mira Murati照片

另一位本科生作者Luke Metz,和Alec都出自欧林工程学院,并在毕业后加入了Alec创立的Indico公司。

他也是OpenAI的初始成员之一,随后他进入谷歌担任长期研究员,研究重心从生成模型逐渐转向优化算法和元学习,并在2022年短暂回归OpenAI,24年底转投Thinking Machines Lab。

Luke Metz头像

最后一位作者Soumith Chintala,他广为人知的身份除了是DCGAN论文作者之一,还是PyTorch的核心作者、Meta前副总裁。

他本科就读于韦洛尔理工学院(VIT),这是一所当地的二流工程院校,这也让他在申请硕士时屡屡碰壁,被12所高校连续拒绝。

直到最后,他终于坚持不懈收到了纽约大学发来的offer,并成功收获LeCun青睐,得以师从LeCun。在那里,LeCun影响了Soumith的研究方向,他开始从事早期深度学习研究。

但在完成硕士学位后,Soumith再次碰壁,几乎申请的全部工作都被拒绝,只能进入一家名为MusiAmi的小型创业公司,从事移动深度学习工作。

直到2014,在Lecun的引荐下,他进入Meta工作,并带领团队成员主导设计了PyTorch。而PyTorch已经成为目前全世界使用最广泛的开源机器学习平台之一。

在Meta工作11年后,Soumith一路从L4工程师晋升至副总裁,成为Meta核心人物。在2025年底,他离开了Meta,并加入Thinking Machines Lab担任CTO。

Soumith Chintala

自此,DCGAN三位作者兜兜转转,最终再次齐聚Thinking Machines Lab

其余获奖情况

除此之外,ICLR还颁布了两篇优秀论文奖:

优秀论文截图

  • 《Transformers are Inherently Succinct》:率先提出简洁性是衡量Transformer表达能力的新维度,同时证明Transformer在描述某些复杂概念时,相比RNN等模型存在指数级甚至双指数级优势。

  • 《LLMs Get Lost In Multi-Turn Conversation》:设计了一种可扩展的方法来评估LLM的多轮对话能力,同时发现当交互涉及多轮对话和指令不明确时,LLM的适应性和可靠性会大幅度下降。

和一篇优秀论文提名:

提名论文截图

其中,研究者运用逼近理论,为主流Muon优化器设计了一套极分解设计最优多项式逼近方案,收获了业界一致的认可。

从DCGAN的十年封神之路,到三位非博士作者最终聚首同一家初创,这背后折射出的不仅是个人奋斗与机遇的交织,更揭示了深度学习领域“英雄不问出处”的独特生态。当学术评价体系越来越看重实际影响力而非学历头衔时,或许会有更多像Alec、Luke、Soumith这样的“非典型”天才涌现,推动技术边界持续拓展。而Thinking Machines Lab集齐这批核心人物后,能否在AGI道路上复刻当年OpenAI的奇迹,值得长期观察。

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行审核删除。
(0)
AI快讯网编辑-青青AI快讯网编辑-青青
上一篇 8小时前
下一篇 6小时前

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

欢迎来到AI快讯网,开启AI资讯新时代!