要指标还是更多有价值的论文,顶级学术会议似乎也面临着「to be or not to be」的难题。
NeurIPS 2025 将于 2025 年 12 月 2 日至 7 日在美国圣地亚哥举办,并且首次设置了墨西哥城作为第二个官方分会场,这体现了会议的国际影响力和扩展决心。然而,最近几天,根据国内外社交媒体的众多反馈,本届 NeurIPS 的 Meta Review(元评审,即多位匿名审稿人提交评审意见后由领域主席或高级审稿人撰写总结性评审)已经陆续完成,反映出了一些值得关注的现象。

出自:MiroMind 研究科学家 Bai Song(小红书)
根据一些领域主席(Area Chair, AC)透露的消息,本届会议的一些评审标准显得较为严苛。例如,有领域主席表示,在数据集和基准测试赛道(DB track),即使得分较高,如 4-4-4-5(均分 4.25),也可能被拒稿。据此前的数据统计,本届 NeurIPS 的投稿数量可能达到史无前例的 30000 篇,进一步增加了评审压力。
一位学者提出了质疑,认为不应对获取审稿人积极评分并达成共识的论文进行拒稿,以保持固定的 20% 到 25% 接收率。该学者呼吁程序主席(Program Chair, PC)提高接收率。但根据高级程序委员会成员(Senior PC)的回复,由于场地和资源有限,加之投稿量超出预期,本届会议不得不严格控制接收率。
作为对比,NeurIPS 2024 的接收率为 25.8%(主会议)和 25.3%(DB),NeurIPS 2023 的接收率为 26.1%(主会议)和 32.6%(DB)。可以看出,接收率的变化引起了投稿人的广泛关注。

出自:Jian Wang—Snap Research(小红书)
加州大学圣塔芭芭拉分校助理教授 Xin Eric Wang 也提到,某些领域主席即使在所有评审意见均为正面的情况下,为了控制接收率,仍会选择拒稿。他回想起几年前的一次 AAAI 投稿经历,一篇评分为 7-7-7-6 的论文仅因结果报告中小数点的书写格式而被拒掉。他表示,当学术会议开始为了名额游戏而拒绝优秀的工作时,其声誉将直线下滑。学术声望不仅源于优秀的投稿,更关键的是公平透明的评审过程。

图源:https://x.com/xwang_lk/status/1960360698942468362
这种现象不仅限于 NeurIPS,其他学术会议如 COLM(Conference on Language Modeling,语言建模会议)也被曝出类似情况。有投稿人展示了自己过去两届 NeurIPS 的“悲惨”经历,分别获得了 8-7-7-6-5 和 7-6-6-6 的高分,最终仍被拒稿。

图源:https://x.com/ayushchopra96/status/1960417136729579841
国外社区也有消息称,NeurIPS 官方正向高级领域主席(Senior Area Chair, SAC)施压,要求他们拒掉已接收的论文,理由是场地限制。这种做法引发了广泛质疑。

官方发给审稿委员会成员的指南显示,领域主席们需要严格执行「专业对口」的原则,确保每篇被录用的论文都因其最核心的贡献而被放在最合适的类别下。这意味着,如果论文的主要贡献在于数据集或基准测试,则不应被研究赛道录取,反之亦然。然而,这种严格的划分标准在论文提交和 rebuttal 阶段并未明确告知,导致一些投稿人感到措手不及。
原则上,研究赛道 (research track) 侧重于技术进步,而数据集与基准测试赛道 (DB track) 则聚焦于数据集和基准测试。我们认识到,这种区分并非总是清晰明了。有些论文将技术贡献与新的数据集或基准测试相结合,这使得确定哪个赛道更为合适变得困难。
然而,由于每个赛道都有其各自的侧重点、提交要求和评审流程,因此将一篇论文录用在错误的赛道上是不公平的。
因此,我们要求所有的领域主席 (ACs) 和高级领域主席 (SACs) 在给出录用建议时,仔细评估每篇论文的主要贡献。如果一篇论文的主要贡献明确在于数据集或基准测试,那么它就不应该被研究赛道录用。反之,如果主要贡献明确是技术性的,那么它就不应被数据集与基准测试赛道录用。如果不清楚哪一个赛道最匹配论文的主要贡献,我们请您在给出录用建议前,与程序主席 (program chairs) 或数据集与基准测试赛道主席 (DB chairs) 进行协商。
感谢您为 NeurIPS 2025 会议程序所做的贡献。
面对这些争议,有人提议将 NeurIPS 拆分成多个按具体研究领域划分的小型会议,以便更好地管理接收率和评审标准。这种方案或许能减少评审过程中的不公,提升会议的质量。

还有学者表达了对“发文指标”的不满,认为将接收指标置于学术价值之上会损害真正的创新。这种体系的问题在于,它可能导致审稿人在未来的互动评审过程中不再愿意提高评分。

图源:https://x.com/dyamins/status/1960769408147841073
正如一位研究人员所言,「当我们把接收指标置于学术价值之上时,真正的创新就会受到损害。」

图源:https://x.com/VibeCodeTeddy/status/1960619413050417671
对于 NeurIPS 2025 的审稿问题,你有什么看法?欢迎在评论区留言。
参考资料:Reddit 讨论链接