本周一(8月19日),人工智能初创公司 Anthropic 在加州联邦法院遭到集体诉讼,被指控侵犯版权。
Anthropic 由前 OpenAI 研究高管创立,其最大的投资者是亚马逊公司,同时还获得了来自谷歌和 Salesforce 等公司的支持。
涉嫌非法窃取版权内容
三位作者在提交给加州联邦法院的文件中指控 Anthropic 通过窃取数十万本受版权保护的书籍来建立其庞大业务,其中包括他们的作品。
作家 Andrea Bartz、Charles Graeber 和 Kirk Wallace Johnson 在诉讼中声称,“Anthropic 商业模式的一个重要组成部分——其旗舰 Claude 系列的大型语言模型,是对版权作品的大规模盗窃”。
Claude 与 OpenAI 的 ChatGPT 和谷歌的 Gemini 一样,是去年爆红的人工智能聊天机器人之一。在这起诉讼之前,Anthropic 于 6 月发布了迄今为止最强大的人工智能模型 Claude 3.5 Sonnet。
诉讼文件指出,Anthropic 从盗版和非法网站下载和复制数十万本受版权保护的书籍,并将其复制到其模型中,这违反了版权法。
对抗与合作:人工智能与版权的博弈
随着人工智能生成内容的普及,许多出版商和媒体机构都在努力保护自己的业务。
去年 10 月,Anthropic 就曾因版权侵权被起诉。根据田纳西州联邦法院的文件,环球音乐起诉这家初创公司“系统而广泛地侵犯了他们的歌词版权”。其他音乐出版商,如 Concord 和 ABKCO 也是原告。
去年 12 月,《纽约时报》对微软和 OpenAI 提起诉讼,指控其新闻内容出现在 ChatGPT 训练数据中,侵犯了知识产权。《芝加哥论坛报》和其他七家报纸也在今年 4 月份提起了类似诉讼。
今年 6 月,美国历史最悠久的非营利新闻机构调查报道中心 (Center for Investigative Reporting) 在联邦法院起诉 OpenAI 及其主要支持者微软侵犯版权。
经历了这些诉讼后,人工智能公司和媒体机构逐渐开始寻求平衡点。一些新闻机构选择与人工智能初创公司合作。
今年 5 月,OpenAI 宣布与新闻集团建立合作伙伴关系,允许 OpenAI 访问来自《华尔街日报》、《市场观察》、《巴伦周刊》、《纽约邮报》和其他出版物的当前和档案文章。Reddit 也在 5 月宣布与 OpenAI 合作,允许后者公司在 Reddit 内容上训练其 AI 模型。
6 月,OpenAI 和《时代》杂志宣布了一项“多年内容协议”,该协议将允许 OpenAI 访问《时代》杂志 100 多年历史上的当前和档案文章。OpenAI 将能够在其 ChatGPT 聊天机器人中显示《时代》杂志的内容,以回答用户的问题,并使用《时代》杂志的内容“增强其产品”,或者更可能用于训练其人工智能模型。
今年 7 月,Perplexity AI 为出版商推出了一种收入分成模式。包括《财富》、《时代》、《企业家》、《德克萨斯论坛报》、《明镜周刊》在内的媒体和内容平台率先加入了该公司的“出版商计划”。
最新案例发生在本周二(8 月 20 日),OpenAI 宣布与康泰纳仕集团 (Cond Nast) 达成合作伙伴关系,ChatGPT 和 SearchGPT 将展示来自《Vogue》、《纽约客》、《CondéNast Traveler》等媒体的内容。