AI偏好新闻内容，版权问题受关注

近日，Ziff Davis公司发布的一项研究报告引发了业界广泛关注，该报告揭示了谷歌、OpenAI和Meta等AI巨头在训练大型语言模型（LLM）时对高质量新闻源的严重依赖。

AI偏好新闻内容，版权问题受关注

研究团队，由Ziff Davis首席AI律师George Wukoson和技术官Joey Fortuna领导，深入分析了包括Common Crawl、C4、OpenWebText和OpenWebText2在内的多个公开承认被AI公司使用的数据集。结果表明，这些数据集的构成中，新闻和媒体网站的高质量内容占据了极大比例。这充分说明了主流AI企业已将新闻内容视为LLM训练的关键资源，对其模型的准确性和性能至关重要。

然而，这种对新闻内容的高度依赖也引发了关于版权和付费的争议。Ziff Davis的研究指出，AI公司大量使用新闻媒体内容却未支付相应费用，这将对新闻出版商的商业模式造成严重冲击，导致其失去重要的许可收入来源。这与目前AI行业迅速发展的态势形成了鲜明对比，也凸显了AI发展与传统媒体行业利益平衡的迫切性。

这种担忧并非空穴来风。此前，已有出版商对OpenAI提起诉讼，指控其未经授权使用其内容训练模型。虽然Raw Story和AlterNet的诉讼被联邦法官驳回，但《纽约时报》等媒体机构的类似诉讼仍在审理中，而OpenAI也已经与部分顶级媒体公司达成了内容授权协议。这些案例表明，AI行业与新闻媒体之间的法律博弈仍在持续，并对未来AI模型的训练方式及数据获取方式提出了新的挑战。

总而言之，Ziff Davis的研究不仅清晰地展现了新闻内容在LLM训练中的核心地位，更迫切地呼吁AI行业重新审视其数据获取方式，寻求与新闻媒体之间更公平、更可持续的合作模式，解决版权和利益分配等关键问题，促进AI技术健康、可持续发展。

免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，可联系本站进行审核删除。

一	二	三	四	五	六	日
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30

AI偏好新闻内容，版权问题受关注

相关推荐

发表回复