导语:新闻出版商称,人工智能工具未经授权使用其内容;而科技公司则声称,使用网络内容来训练人工智能属于“合理使用”。
《纽约时报》以涉嫌侵犯版权为由,起诉微软和OpenAI,引发了一场关于生成式人工智能技术的法律争斗,对新闻出版业的未来产生深远影响。
在周三提交的诉状中,纽约时报指称这两家科技公司未经允许使用其内容来开发其人工智能产品,其中包括OpenAI的类似人类的聊天机器人ChatGPT和微软的Copilot。诉讼中提到,这些工具是基于数百万篇纽约时报的内容进行训练的,并使用这些素材来回应用户的请求。
在纽约时报的诉状中,该报声称它是OpenAI和微软人工智能产品最主要的专有信息来源之一。这些人工智能工具转移了原本应该访问纽约时报网站的流量,导致该公司失去广告、许可和订阅收入。
纽约时报要求获得赔偿,同时请求法院制止这些科技公司使用其内容,并要求销毁包含纽约时报作品的数据集。
纽约时报在诉状中指出:“纽约时报的新闻是成千上万记者辛勤工作的结果,每年雇佣成本数以亿计。被告未经许可或补偿占用了这项工作,事实上避免了纽约时报数十亿美元的投资。”
纽约时报要求陪审团审理此案,该案已提交至美国纽约南区联邦法院。
OpenAI的女发言人在一份声明中表示:“我们尊重内容创作者和拥有者的权利,致力于与他们合作,确保他们从人工智能技术和新的收入模式中受益。我们一直在积极且有建设性地与纽约时报进行商谈,因此对此次发展感到意外和失望。我们希望能找到一种双方都受益的合作方式,就像我们与许多其他出版商一样。”
微软发言人未发表评论。
通常情况下,开发生成式人工智能工具的科技公司辩称,可以根据合理使用的法律规定,使用开放互联网上的内容来训练他们的技术,这一规定允许在某些情况下使用受版权保护的材料而无需许可。
然而,在纽约时报的诉状中指出,合理使用的论点不适用,因为这些人工智能工具几乎可以原封不动地呈现纽约时报新闻文章中的大段文字。
新闻媒体联盟首席执行官丹尼尔·科菲表示:“《纽约时报》已经非常明确地表明了保护新闻内容的价值和重要性。如果以合作的方式来看待,优质新闻和这些新技术,尤其是那些与相同受众竞争的技术,是可以相互补充的。”
生成式人工智能的法律环境目前还不明朗,因为这项技术仍处于早期阶段。还有其他诉讼案可能会测试人工智能公司从网络上获取内容来训练人工智能工具的权利,其中包括一些著名书籍作者对OpenAI提起的诉讼。今年2月,Getty Images公司在特拉华州对人工智能艺术公司Stability AI提起了诉讼,指控后者侵犯了Getty的版权。当时,Stability AI表示不会对未决诉讼发表评论。
美国版权局表示,已经启动了一个研究与人工智能相关问题的倡议,包括“在人工智能培训中使用受版权保护材料”的问题。根据其网站,该机构在8月份发布了一份征求意见通知,并正在评估是否需要采取立法或监管措施。
哈佛法学院知识产权专业教授丽贝卡·图什内特表示,以前的案例,包括书籍作者起诉谷歌侵犯版权并败诉的案件,表明《纽约时报》在其人工智能诉讼中可能会面临一定的困难。她说:“现有原则指向一个方向,但原则总是可以改变的。”
图什内特表示,尽管针对谷歌的诉讼是在该搜索引擎已经成为互联网经济中的一部分之后才出现的,但在生成式人工智能浪潮刚刚兴起的时候,现在的诉讼已经出现了。她说:“我们不知道这项技术最终会被用来做什么。”
纽约时报的诉讼引发了出版界的一个可能性——如果一些主要媒体跟随纽约时报采取法律行动,而其他媒体则与OpenAI、微软和谷歌(谷歌正在开发自己的人工智能项目)协商获得补偿,那么出版界可能会分道扬镳。
已经有一些出版商,包括美联社和Axel Springer,这是Politico和Business Insider等网站的出版商,已经达成商业协议,授权OpenAI使用他们的内容。
IAC主席巴里·迪勒拥有诸如Better Homes & Gardens、People和Verywell Health等网站,他表示他认为出版商的版权正在受到侵犯。
《华尔街日报》母公司新闻集团首席执行官罗伯特·汤姆森对人工智能表示担忧,包括工具可能在未经许可的情况下使用出版商的内容。新闻集团已经与人工智能公司进行商业讨论,但尚未宣布任何许可协议。
在过去的十年里,许多新闻媒体高管对科技公司持怀疑态度。谷歌和Facebook曾帮助出版商触及受众并增加其网站流量,但这些科技公司后来变成了在线广告市场的强大竞争对手,并具备了通过算法变更来扩大或减少新闻流量的能力。
由于他们认为未能在搜索和社交媒体推动的互联网增长中获得公平份额,出版商不想在人工智能领域再次遭受同样的命运。
一些新闻机构正在研究如何利用这项技术来增强自身竞争力,包括自动出版和生成新闻标题或文章。但媒体公司也看到了潜在的威胁。AI工具,如ChatGPT、Copilot和Google的搜索AI工具,能够提供详细的问题答案,这可能减少用户点击新闻来源链接的需求,从而减少了这些网站的流量和广告收入。
去年,OpenAI发布了引人瞩目的ChatGPT,该工具能够生成对几乎任何用户查询的人类化书面回应,涵盖了从莎莎酱食谱到希腊旅行计划再到历史事件的各种主题。
微软成为OpenAI的主要合作伙伴,同意投资130亿美元并获得公司盈利部分的实际上占49%的股权。
《纽约时报》称,OpenAI和微软创建的人工智能工具部分基于其内容,已经显著提高了它们的估值。《纽约时报》表示:“未经付款以这种方式使用他人宝贵的知识产权对被告非常有利可图。”
《纽约时报》的出版商A.G.苏兹伯格在公开场合没有像一些同行那样公开表达对生成式人工智能平台对新闻行业构成威胁的担忧。然而,他的公司目前却是反对人工智能公司的法律斗争的领头羊。
《纽约时报》表示,它在4月份联系了微软和OpenAI,试图达成商业协议。公司在其诉状中表示:“纽约时报在这些谈判中的目标是确保其内容的使用能够获得公平的价值,促进健康的新闻生态系统的持续发展,并以有益于社会、支持公众知情权的方式负责任地推动生成式人工智能技术。”纽约时报还提到了其与其他主要科技平台达成的协议。
纽约时报将数字订阅置于优先地位,提供了一个捆绑套餐,其中不仅包括新闻,还包括体育、烹饪、游戏和产品推荐等内容。在第三季度,该公司报告称已经拥有超过900万名纯数字订户。
纽约时报提供了几个例子,展示了OpenAI的ChatGPT生成的内容与《纽约时报》文章中的段落非常相似。例如,诉状中提到,OpenAI复述了一份基于对纽约市出租车行业进行了18个月调查的2019年报告的大部分内容。
在诉讼中,纽约时报表示:“法律不允许被告所犯下的这种有组织的、具有竞争性的侵权行为。”(WSJ)