申请转发项目推文近一年才批准?
近日,Meta CEO 马克・扎克伯格发表的一篇《个人超级智能》公开信引起了广泛关注。信中不仅提到他们已经看到“AI 系统自我改进的迹象”,还表示将会“谨慎选择开源内容”。

这封信发布后,相关的讨论和争议达到了新的高潮。与此同时,Meta 内部风波不断。为了追赶 AI 领域的顶级研究,Meta 投资超过 140 亿美元建立了 Scale AI 项目,并成立了 Meta Superintelligence Labs (MSL),吸引了来自 OpenAI、DeepMind 等顶级团队的 AI 人才,提供百万乃至上亿美元的签约金。然而,Meta 内部却频繁曝出资源、人力和内部管控等管理问题,甚至有研究科学家 Tijmen Blankevoort 发表长文控诉 Meta 内部文化和组织失调的状况。
现在,更多有关 Meta 内部混乱和低效的细节浮出水面。扎克伯格《个人超级智能》公开信发布几小时后,Meta FAIR 研究科学家朱泽园在推文中表示:“让 AI at Meta(@AIatMeta)这个 X 账号转发一下他的研究非常困难——我花了近一年时间才让他们批准转推我的项目,但转推带来的触达量还不到他自己推文的 10%。”
朱泽园表示:“根本不值得这么费力。”他还提到:「话虽如此,我理解。我的工作在 Meta 内部并不被看重,所以他们自然有更重要的事情需要社交媒体推广。」不过有趣的是,他还提到 Meta 以外的公司对他的工作更感兴趣,这是否暗示他未来会有新的工作动向?

朱泽园回应称,他非常感谢社区和粉丝一直以来帮助推广自己的项目。他解释道,Meta 关注的是如何盈利,以及大模型之间的竞赛。他的Physics of Language Models项目从一开始就几乎没有获得 Meta 层面的支持与关注。
他表示,近期收到了大量同行的来信,不少 AI 从业者都对行业动荡感到焦虑。「我想提醒大家,面对行业变化,更应该变被动为主动,把握机会,不要等着公司裁员。其实现在正是跳槽的好时机。」至于个人是否跳槽,朱泽园表示,自己终归会离开 Meta,但目前更看重手头项目,需要节省时间,而跳槽时还要花时间考虑是否要带一个团队、带哪些人一起走,所以现在暂时不会做这件事。金钱反而不是最重要的。他强调,无论身处何处,都会继续做 Physics of Language Models,因为这是 AI 领域最基础的工作。
针对 Meta 内部的管理问题,朱泽园坦言,前员工 Tijmen Blankevoort 公开的内部文化批评「基本属实」,而他其实还有很多补充,比如甚至遇到过现实版「农夫与蛇」的经历,但这些故事只能等离职后才能说出来。
至于这条推文提到的“对照实验”,则要从朱泽园上周末发布的开源项目说起。朱泽园在 7 月 27 日发布了 Physics of Language Models 项目的第一阶段代码,其中包含了「在 42k GPU 小时内预训练强大 8B 基础模型所需的全部内容」,包括数据、训练代码和模型权重,可谓是真正的开源。该项目声称“可以用不超过 10% 的训练资源打败 Llama3-8B”。
项目地址:https://github.com/facebookresearch/PhysicsLM4

然而,项目开源发布一段时间后,朱泽园发现项目关注度不高,这让他不禁发出了痛心一问:“完全开源的研究真有必要吗?”他还问道:“我是否应该选择闭源以节省时间并专注于纯粹的研究?”

而这条推文的关注热度却高多了,也有很多业内人士参与讨论互动。比如 Hugging Face CEO Clement Delangue 表示开源是推动 AI 领域发展的正确做法,可以使其更加开放、协作和安全。

斯坦福大学应用物理学副教授 Surya Ganguli 更是表示「不开源就不能称之为研究」。当然,也有人表示某些开源确实浪费时间,比如前段时间被 Meta 挖走的前 OpenAI 和 DeepMind 研究者 Lucas Beyer 表示 bigco 项目的开源就浪费了很多时间,不过他也指出了值得开源的三种情况。

当然,除了开源以及对 X 推荐机制的讨论,朱泽园的这条推文也引出了更多关于 Meta 的讨论。比如网友 @papers_anon 表示「FAIR 在传播其团队的有趣研究方面做得很差」——FAIR 似乎完全依赖研究者使用自己的个人 X 账号来宣传,而同时 FAIR 又不直接为每位研究者购买 X Premium+ 来推广研究成果,也没有一个真正专注于研究成果展示的 X 账号来发布内容。他总结说:「FAIR 似乎受到了太多内部政策的束缚,甚至无法以无痛的方式促进开放研究。」
朱泽园自己也指出了关注度可能与研究资源挂钩的现实,而这不得不迫使研究者在 X 上进行宣传,而他也正需要为这项研究的第二、三阶段争取到 GPU 资源。


他还吐嘈了 Meta 内部的审核批准流程:仅仅是获得公共数据集的使用批准并发布权重就需要浪费两个多月的时间(这还不包括科研本身),「而且情况只会越来越糟。如果一个数据条目未获得批准,你的整个模型都可能被推翻重新训练。而哪里有这么多资源呢?」


他还提到,光是为了让 Physics of Language Models 项目以 Apache 2.0 协议开源,他就与 Meta 的法务部门沟通了超过一周。如果发布的模型过于强大,还会出更多问题。

当被问到为什么 Meta 说不开源了,同时还允许该项目发布时(另外这两天还开源了 MetaCLIP2 和 VGGT),朱泽园风趣地说:「这两者可能都是真的。如今,不确定性极大,一切都可能在一夜之间发生改变,也许我们在进行最后一轮开源。」

参考链接
https://x.com/papers_anon/status/1950672022134247579
https://x.com/ZeyuanAllenZhu/status/1950718378353811730