据报道,被亚马逊投资了40亿美元的人工智能初创公司Anthropic,在加州联邦法院遭到集体诉讼,被指控侵犯版权。原告包括安德里亚·巴茨(Andrea Bartz)、查尔斯·格雷伯(Charles Graeber)和柯克·华莱士·约翰逊(Kirk Wallace Johnson),他们指控Anthropic窃取他们作品来训练其人工智能模型。
据悉,Anthropic由前OpenAI研究高管创立,亚马逊在2023年9月及2024年3月,亚马逊先后向Anthropic投资总计40亿美元,创下亚马逊单家公司投资纪录,同时也成为Anthropic最大的投资者。这笔投资括了AWS资源和服务的使用协议。双方合作着重于生成式AI领域,Anthropic的大模型被整合进亚马逊Bedrock平台,同时将其指定为首选云服务提供商。
此外,Anthropic还收获了包括谷歌和Salesforce公司在内的支持。
指控Anthropic窃取内容训练Claude聊天机器人
Claude是 Anthropic 开发的一款高级人工智能聊天机器人,与OpenAI的ChatGPT和谷歌的Gemini一样,是去年人气爆发式增长的聊天机器人之一。
Claude可以生成文本内容、参与对话、总结文档、编写代码并回答各种主题的问题,Claude可通过聊天界面和 API 进行访问,因此很容易集成到不同的工作流程中,如可在 AWS 和 GCP 等平台上使用。
Claude 系列包括针对不同任务定制的不同模型,在这起诉讼之前,Anthropic于6月推出了迄今为止最强大的人工智能模型Claude 3.5 Sonnet。
上述三位作者在递交给加州联邦法院的一份文件中写道,Anthropic通过窃取数十万本受版权保护的书籍,建立了规模庞大的业务。Anthropic窃取的内容就包含了他们的作品。
作家Andrea Bartz、Charles Graeber和Kirk Wallace Johnson在诉讼中声称,“Anthropic商业模式的一个重要组成部分——旗舰Claude系列的大型语言模型,是对版权作品的大规模盗窃”。
诉讼中写道,版权法禁止Anthropic所做的事情:它从盗版和非法网站下载和复制数十万本受版权保护的书籍,进行了复制,并将这些盗版版本输入其模型。
这不是 Anthropic 第一次面临法律问题
事实上,这不是 Anthropic 第一次面临法律问题。2023 年 10 月,环球音乐公司(Universal Music)起诉该公司涉嫌侵权歌词,其他音乐出版商,如Concord和ABKCO也在原告之列。
去年12月,《纽约时报》对微软和OpenAI提起诉讼,指控其新闻内容出现在ChatGPT培训数据中侵犯了知识产权。《芝加哥论坛报》和其他七家报纸也在今年4月份提起了类似诉讼。
今年6月,美国历史最悠久的非营利新闻机构调查报道中心(Center for Investigative Reporting)在联邦法院起诉OpenAI及其主要支持者微软侵犯版权。
此外,Anthropic还因亚马逊对其的40亿美元投资,而被英国竞争与市场管理局(CMA)展开反垄断调查。
人工智能公司如何避免版权纠纷
众所周知,为了构建高效且准确的模型,人工智能公司必须依赖于大量的文本、图像、音频和视频数据来进行训练。这些数据可以帮助模型学会识别模式、理解语言、分析图像等内容。如使用已经公开授权的数据集,包括遵循Creative Commons许可的数据,或 尽可能开发和使用专有数据来训练人工智能模型,以减少对第三方内容的依赖,并将法律风险降至最低。
此外,因此人工智能公司与媒体组织的合作变得尤为重要。例如,OpenAI已经与新闻集团、Reddit、《时代》杂志、康泰纳仕集团(Condé Nast)等媒体组织建立了合作关系,以便在遵守版权法规的前提下获取训练数据。
Perplexity AI则为出版商推出了一种收入分成模式。包括《财富》、《时代》、《企业家》、《德克萨斯论坛报》、《明镜周刊》在内的多家媒体和内容平台率先加入了该公司的“出版商计划”。