近日,OpenAI 高层发生人事变动,引发业界热议。
联创 John Schulman 宣布辞职,并加入了竞争对手 Anthropic,也就是 Claude 团队。联创兼总裁 Greg Brockman 则宣布将休长假至年底,产品副总裁 Peter Deng 也被曝已离职。
John Schulman 长期领导 OpenAI 强化学习团队,被誉为“ChatGPT 架构师”。
在 Ilya Sustkever 离开后,他临时接管了超级对齐团队。
他这次离职的官方说法是希望加深对 AI 对齐的关注,并开启职业生涯的新篇章。
与此同时,OpenAI 总裁 Greg Brockman 也宣布将休长假,直至年底。
OpenAI 计划在 10 月 1 日起在全球各地举办开发者日等活动,Brockman 也将缺席。
Brockman 声称这是他九年来第一次长期休假,但对于年底后的计划语焉不详,有网友猜测可能是出于保密协议。
OpenAI 创始人 Sam Altman 在舒曼离职官宣后,对其贡献表示感谢,并回忆了两人 2015 年初次见面的情景。
但截至目前,Altman 对 Brockman 休假一事没有任何回应。
Altman 平时习惯在打字时句首字母和“i”不用大写,但当重要同事离职时,他都会表现得更正式。
著名 OpenAI 内幕爆料账号“苹果哥”表示:现在领导层已经成了一个空壳,你们还是赶紧发布产品吧。
Schulman 本科在加州理工学习物理,在加州大学伯克利分校短暂学习过神经科学,后来师从强化学习领域的大牛 Pieter Abbeel,获得计算机科学博士学位。
他加入 OpenAI 时,博士尚未毕业。
OpenAI 是他实习之外的第一家也是唯一一家公司。
舒曼的代表作,也是他最高引论文 PPO,被应用于 ChatGPT 核心技术 RLHF 中的强化学习算法。
之后,他一直领导着 OpenAI 从 GPT-3.5、GPT-4 到 GPT-4o 的一系列对齐/后训练工作。
舒曼表示,自己这次离职的原因是希望更深入地研究 AI 对齐,开启职业新篇章,并重返技术工作。他强调,并非因为 OpenAI 不支持安全对齐工作而离开,而是出于个人希望专注于此。
在 ICML2023 的演讲中,舒曼提到了他对未来的研究方向之一:如何避免过度优化。
ChatGPT 中出现的过度道歉等令人讨厌的行为就是过度优化的结果。
由于 RLHF 很容易对狭窄的指标进行过度优化,模型可能会学会获取奖励的捷径,但并没有真正理解。
合适的对话任务训练需要推理、换位思考和知识,研究人员需要精心设计训练过程、奖励功能和数据集。
奖励信号必须评估整个对话的质量,而不是仅仅关注个别反馈。
舒曼在今年 5 月与播客主持人 Dwarkesh Patel 的访谈中也表示,算力应该更多地从预训练转移到后训练。
由于在 AI 安全方面的理念与 Altman 不合,OpenAI 人才大量流失。
今年 5 月,超级对齐团队的两名负责人,首席科学家 Ilya Sutskever 和 RLHF 发明者之一 Jan Leike 在同一天相继离开 OpenAI。
当时超级对齐团队成立不到一年。
Jan Leike 离开后,更是连发十几条推文,公开批评 OpenAI 没有履行 20% 算力承诺,并且对安全的重视程度远低于产品。
Leike 后来加入了 OpenAI 的竞争对手 Anthropic,继续进行超级对齐研究。
与 Leike 在 GPT-4 项目中共同领导对齐工作的 Ryan Lowe 也于 3 月底离开 OpenAI。
超级对齐成员 William Saunders 和参与 GPT-4 对抗性测试的 Daniel Kokotajlo 也相继离职。
更不用说 Anthropic 的创始人 Dario Amodei 和 Daniela Amodei 兄妹,他们也是 OpenAI 出身。
哥哥 Dario 离开前是 OpenAI 的研究副总裁,妹妹 Daniela 是安全与策略部门副总监,他们离开时还带走了包括 GPT-3 首席工程师 Tom Brown 在内的十几名员工,加入 Anthropic。
其中一个促使他们选择创业的原因是 OpenAI 在尚未解决安全问题的情况下就发布了 GPT-3,引起了他们的不满。
Anthropic 对安全的重视,加上创始人背景,也让它成为了包括 Leike 和 Schulman 在内的 OpenAI 员工的主要去处之一。
OpenAI 最近在安全工作上也采取了一些行动。7 月末,OpenAI 将安全部门高级主管 Aleksander Madry 调离安全岗位,并给他分配了“AI 推理”的工作。
但 OpenAI 告诉媒体,Madry 在新职位上仍将致力于人工智能安全工作。
CEO Altman 也强调,OpenAI 一直都很重视安全工作,并坚持“给整个安全团队至少 20% 算力”的承诺。
但眼尖的网友很快发现,Altman 在玩文字游戏。他原来承诺的是给超级对齐团队 20% 算力,现在却偷偷改成了整个安全团队。
在内部人才流失的同时,OpenAI 的“老仇人”马斯克也有新的动作。
马斯克再次将 OpenAI 告上法庭,一同被告还有 Altman 和 Brockman。
马斯克认为自己当初参与创立 OpenAI 时,遭到了 Altman 和 Brockman 的“欺骗和敲诈勒索”。
马斯克称,自己当初参与和投资 OpenAI 是因为相信了 Altman 的承诺,当时 Altman 承诺 OpenAI 是一家安全、开放的非营利组织。
但后来 OpenAI 变成了营利性组织,还把部分股份卖给了微软,这令马斯克感到十分不满,认为自己被背叛,并痛斥 Altman “背信弃义”。
马斯克的律师 Marc Toberoff 表示,这次诉讼与之前撤回的诉讼有很大不同,要求被告“对故意向马斯克和公众做出虚假陈述的行为负责”,并寻求“大规模追回他们的不义之财”。
同时,起诉书还要求撤销 OpenAI 对微软授予的许可。
[1]
[2]
[3]
[4]
[5]















