纽约时报起诉微软、OpenAI，擅用其文章训练大模型-电子工程专辑



 0

 收藏

 分享

扫码分享到微信好友

 扫一扫

扫码查看更多文章

《纽约时报》起诉微软和OpenAI，指控这两家公司依赖数百万篇受版权保护的文章来训练ChatGPT等聊天机器人和其他AI功能。这场诉讼揭开了新闻行业与AIGC工具之间战争的序幕，接下来其他受到AI冲击的行业或许也将效仿。判决结果或考验现有法律框架，能否应对生成式AI技术带来的冲击。

12月28日消息，据外媒报道，《纽约时报》公司在纽约南区联邦法院起诉微软和OpenAI，指控这两家公司未经许可使用它的内容训练人工智能（AI）大型语言模型 (LLM)，侵犯了它的版权。

这一事件反映出媒体与一项可能颠覆新闻行业的技术之间的关系正变得日益紧张。

证据列举：未经授权的抄袭，“偷走”了媒体的收入

根据27日（周三）提起的诉讼内容，这些科技公司被控依赖数百万篇受版权保护的文章来训练ChatGPT等聊天机器人和其他AI功能，这些技术生成的内容现在与《纽约时报》的内容竞争，据称造成被侵权方数十亿美元的损失。

《纽约时报》现时有三分之二以上的收入来自订阅，而广告则占约两成。

《纽约时报》在诉讼中指出，OpenAI和微软“试图在《纽约时报》已经在新闻业进行巨额投资的基础上搭便车”，称它们“未经付费使用《纽约时报》的内容，创造了《纽约时报》的替代品并利用其把受众吸引走”。

纽约时报公司已经聘请律师事务所Susman Godfrey作为其在这场诉讼中的首席外部法律顾问。该诉讼未提出具体的赔偿金额要求，但《纽约时报》指出，被告应为“非法复制和使用《纽约时报》独特且有价值的作品”和与之相关的“价值数十亿美元的法定和实际损失”负责。

除了寻求知识产权保护外，《纽约时报》的诉讼将ChatGPT和其他AI系统描绘为新闻业潜在的竞争对手。当聊天机器人被问及时事新闻或其他相关话题时，它们可以利用《纽约时报》过去的新闻报道来生成回答。《纽约时报》认为，一些读者会对聊天机器人的回答感到满意，不再访问《纽约时报》网站，从而减少能够转化为广告和订阅收入的网站流量。

《纽约时报》在诉讼中引用了几个案例，其中显示聊天机器人向用户提供的内容与《纽约时报》的文章几乎一字不差，而这些文章在《纽约时报》网站上需要付费订阅才能阅读。

微软必应搜索的“以必应浏览”（Browse With Bing）功能，几乎一字不差地重现了《纽约时报》旗下评测导购网站“The Wirecutter”的内容，但必应既没有为相关内容给出引用链接，也删除了“The Wirecutter”在产品推荐中附加的返利链接。《纽约时报》认为，这一行为导致了“The Wirecutter”文章的流量减少，进而导致了收入损失。

抄袭就算了，你还瞎编？

《纽约时报》表示，OpenAI和微软特别强调这些AI在训练时使用了《纽约时报》的新闻报道，因为他们认为这些材料具有可靠性和准确性。

但《纽约时报》同时警告称，AI的“幻觉”问题可能对媒体的品牌声誉造成潜在伤害，因为聊天机器人会在回答中插入虚假信息并错误地将其归因于某一信息源。

诉状对此也引用了几个案例，其中，微软的Bing Chat提供了据称是来自《纽约时报》的错误信息。例如，Bing Chat会提供“15种最有益于心脏健康的食物”的搜索结果，而其中有12种食物在《纽约时报》的对应文章中并未提及； Bing 还称《纽约时报》发表了一篇名为「橙汁导致淋巴瘤」的文章，但实际上《纽约时报》从来没写过这篇报道。这无疑将 OpenAI 置于更加不利的地位。

此外，《纽约时报》要求两家公司销毁任何使用到《纽约时报》版权材料的聊天机器人模型和训练数据。微软和OpenAI的代表没有立即回复置评请求。

部分媒体已经和OpenAI达成合作

自OpenAI于2022年底推出ChatGPT，这一程序现已吸引力1.8亿用户，被用于编程、写作业、综述新闻等用途，被誉为新科技革命的“排头兵”。而必应搜索引擎因包含了新的人工智能程序“必应聊天”，也使搜索引擎的传统巨头谷歌感到了深深的危机感，促发了全球性的一波“AI热”。

但同时，OpenAI也因从网络上广泛抓取文本来训练广受欢迎的聊天机器人而受到批评。据悉，为了训练其大语言模型，OpenAI会利用从网络收集来的大量数据，这些数据集包括维基百科文章、著名小说、社交媒体帖子等所有内容，而OpenAI没有获得任何许可。

这次是大型媒体机构第一回对此类做法提起诉讼。OpenAI此前已经寻求与出版商达成许可协议，就像谷歌和Facebook近年来所做的那样。

一些新闻机构已经达成了让ChatGPT使用其新闻报道的协议，例如，美联社在七月与OpenAI达成了一项许可协议，而德国媒体巨头斯普林格集团（Axel Springer）也在本月也和OpenAI达成了类似协议，建立全球合作伙伴关系。这些协议的具体条款并未公开。

诉状称，《纽约时报》公司在4月份曾经与微软和OpenAI联系，《纽约时报》首席执行官梅雷迪思·科皮特·莱维恩也曾表示，“对于已经被用于训练模型的内容，以及将继续被用于训练模型的内容，必须进行公平的价值交换。”

但这场谈判最终未能达成友好解决方案。

OpenAI发言人Lindsey Held在一份声明中表示：“我们尊重内容创作者和所有者的权利，并致力于与他们合作，确保他们从人工智能技术和新的收入模式中受益。我们与《纽约时报》正在进行的对话是富有成效的，并在建设性地向前推进，所以我们对这一事态发展感到惊讶和失望。我们希望找到一种互惠互利的合作方式，就像我们与许多其他发行商所做的那样。”

原创内容工作者群起而攻之

除了纽约时报外，OpenAI还面临其他内容制作者的多起诉讼，他们抱怨自己的作品被不当用于AI培训。该公司还面临文化界人士的集体诉讼，其中包括喜剧演员萨拉·西尔弗曼（Sarah Silverman）、《权力的游戏》作者乔治·马丁（George R.R. Martin），以及普利策获奖作家迈克尔·夏邦（Michael Chabon）。

今年6月份，在一项集体诉讼中，OpenAI被控非法使用图书数据来训练其新型AI聊天机器人工具ChatGPT。这起在加州提起的集体诉讼称，不遵守适当的采购指导方针，包括征求最初制作这些内容的人的同意，就相当于直接盗窃数据。

此外今年9月份，美国作家协会和17位知名作家也曾在纽约南区对OpenAI提起集体诉讼，他们指控OpenAI将他们的版权作品用来“训练数据”。今年11月底，他们指出，鉴于微软与OpenAI的关系，他们计划将微软列为被告。

这些案件尚处于早期阶段，可能需要数年时间才能完全解决。

微软是OpenAI的最大股东，并在Copilot等几款产品中嵌入这家初创公司的人工智能工具。在诉讼中，纽约时报公司指控微软为其“必应”（Bing）搜索引擎逐字复制了该报的文章，并利用OpenAI的技术将市值提高了1万亿美元。

自ChatGPT于2022年11月推出以来，微软股价累计上涨55%，市值达到2.8万亿美元。

纽约时报公司发言人27日在一封邮件声明中表示，“如果微软和OpenAI想将我们的工作用于商业目的，法律规定他们首先必须得到我们的许可，可他们没有这样做。”

一场里程碑式的诉讼

OpenAI是由特斯拉CEO埃隆•马斯克（Elon Musk）、美国创业孵化器Y Combinator总裁阿尔特曼、全球在线支付平台PayPal联合创始人彼得·蒂尔等硅谷科技大亨于2015年联合创立的一家美国人工智能研究公司，主攻人工智能技术应用领域。

据彭博社上周报道，OpenAI 目前正在与投资者洽谈新一轮融资，估值将达到 1000 亿美元，这将使其成为美国估值第二高的初创企业。

在过去的一年里，生成式AI继续繁荣发展，媒体机构一直在研究这种繁荣会给他们的法律、财务和新闻带来怎样的影响。《纽约时报》在诉讼中写道：“如果《纽约时报》和其他新闻机构无法制作和保护独立的新闻报道，将会造成一个计算机和AI无法填补的真空。这将会减少新闻报道的生产，让社会付出巨大的代价。”

这场诉讼可能会考验现有法律框架，能否应对生成式AI技术带来的冲击。《华尔街日报》称，这起诉讼为科技公司和媒体公司之间长达数年的互联网经济争夺战开辟了一条新战线，使新闻行业的一家重头企业与新一波AI技术的先驱展开较量。这场法律之争对新闻出版行业的未来将产生深远影响。

责编：Luffy

阅读全文，请先

知识产权/专利人工智能软件业界新闻

纽约时报起诉微软、OpenAI，擅用其文章训练大模型

证据列举：未经授权的抄袭，“偷走”了媒体的收入

抄袭就算了，你还瞎编？

部分媒体已经和OpenAI达成合作

原创内容工作者群起而攻之

一场里程碑式的诉讼

杂志声明