点击蓝字 关注我们
SUBSCRIBE to US
Moor Studio/Getty Images
聊天机器人革命让我们的世界充斥着人工智能生成的文本:它已经渗透到我们的新闻推送、学术论文和各种邮件中。虽然听起来似乎有些荒谬,但其内容如此丰富,以至于该行业如雨后春笋般涌现,可以提供行动和对策。一些公司提供服务,通过分析材料来识别人工智能生成的文本,而另一些公司则表示,他们的工具将“人性化”你的人工智能生成文本,使其无法被检测到。这两种工具的性能都值得怀疑,随着聊天机器人变得越来越好,判断合成文本和人工书写文本变得越来越困难(https://www.trails.umd.edu/news/detecting-ai-may-be-impossible-thats-a-big-problem-for-teachers)。
这里还有另一种方法:从一开始就在文本中添加某种水印或内容凭证,这样人们就可以很容易地检查文本是否是人工智能生成的。近日发表在《自然》杂志上的谷歌DeepMind的新研究提供了一种实现这一目标的方法。谷歌DeepMind研究副总裁、该论文的合著者Pushmeet Kohli表示,这个名为SynthID Text的系统不会损害“文本生成的质量、准确性、创造力或速度”。但研究人员承认,他们的系统远非万无一失,而且还不是每个人都能使用的——它更多的是一种演示,而不是一种可扩展的解决方案。
谷歌今天宣布,该公司已经将这种新的水印系统集成到其Gemini聊天机器人中。它还开源了该工具,并将其提供给开发人员和企业,允许他们使用该工具来确定文本输出是否来自他们自己的大型语言模型(LLM),即为聊天机器人提供动力的人工智能系统。然而,目前只有谷歌和这些开发人员可以使用检查水印的检测器。正如Kohli所说:“虽然SynthID不是识别人工智能生成内容的灵丹妙药,但它是开发更可靠的人工智能识别工具的重要基石。”
内容凭证的兴起
内容凭证一直是图像和视频的热门话题,并被视为打击深度伪造兴起的一种方式。科技公司和主要媒体机构联合发起了一项名为C2PA的倡议(https://c2pa.org/),该倡议制定了一个将加密元数据附加到图像和视频文件的系统,指示它们是真实的还是人工智能生成的。但文本是一个更难的问题,因为文本很容易被修改以掩盖或消除水印。虽然SynthID text不是第一个为文本创建水印系统的尝试,但它是第一个在2000万个提示上进行测试的系统。
从事内容凭证工作的外部专家认为DeepMind的研究是一个很好的步骤。微软媒体来源总监兼C2PA执行主席Andrew Jenks表示,它“有望改善C2PA对文档和原始文本的持久内容凭证的使用”。C2PA指导委员会成员Bruce MacCormack说:“这是一个很难解决的问题,很高兴看到取得了一些进展。”
谷歌的文本水印是如何工作的
SynthID Text通过谨慎地干扰生成过程来工作:它以一种人类看不见但SynthID检测器清晰的方式改变了聊天机器人输出给用户的一些单词。研究人员在论文中写道:“这种修改在生成的文本中引入了统计签名。在水印检测阶段,可以测量签名以确定文本是否确实由带水印的LLM生成。”
为聊天机器人提供动力的LLM通过逐字生成句子,查看之前的上下文来选择可能的下一个单词。本质上,SynthID Text通过随机为候选单词分配数字分数并使LLM输出单词得分更高来进行干扰。稍后,检测器可以接收一段文本并计算其总分;有水印的文本将比无水印的文本具有更高的分数。DeepMind团队检查了他们的系统与其他改变生成过程的文本水印工具的性能,发现它在检测水印文本方面做得更好。
然而,研究人员在他们的论文中承认,修改Gemini生成的文本并欺骗探测器仍然很容易。即使用户不知道要更改哪些单词,但如果他们对文本进行大幅编辑,甚至要求另一个聊天机器人对文本进行总结,水印可能会被掩盖。
按比例测试文本水印
为了确保SynthID Text真的不会让聊天机器人产生更糟糕的响应,该团队在给Gemini的2000万个提示上进行了测试(https://gemini.google.com/)。其中一半的提示被路由到SynthID Text系统并得到带水印的响应,而另一半则得到标准的Gemini响应。从用户的“thumbs up”和“thumbs down”反馈来看,水印回复与标准回复一样让用户满意。
这对谷歌和基于Gemini的开发人员来说是件好事。但是,要解决识别人工智能生成的文本(有人称之为AI slop)的全部问题,将需要更多的人工智能公司实施水印技术——理想情况下,以可互操作的方式,这样一个检测器就可以识别来自许多不同LLM的文本。即使所有主要的人工智能公司都签署了一些协议,也仍然存在开源LLM的问题,可以很容易地更改LLM以删除任何水印功能。
C2PA的MacCormack指出,当你开始实际考虑实现时,检测是一个特别的问题。他说:“在自然环境中对文本进行审查存在挑战,你必须知道应用了哪种水印模型,才能知道如何以及在哪里寻找信号。”他说,总的来说,研究人员的工作还有待完成。MacCormack表示,这项努力“不是一条死胡同,但这还只是漫长道路上的第一步”。
微信号|IEEE电气电子工程师学会
新浪微博|IEEE中国
· IEEE电气电子工程师学会 ·
往
期
推
荐
著名的IEEE荣誉奖章奖金提高至200万美元
【乘数而上 · 梦由她创】2024 IEEE女工程师领导力峰会11月2日将在北京召开!
现有Wi-Fi设备也能轻松实现LoRa远程传输
新研发6-mW开源塑料芯片可以运行机器学习任务