为何无法构建出无偏见的AI语言模型

原创陈芝麻 2023-09-28 08:07

【50份好礼】首发直播：解密Keysight最新模拟信号源 精密双向电流感应放大器设计方案

AI语言模型最近已成为美国文化战争的最新前沿先锋，右翼评论员指责ChatGPT带有一种“觉醒的偏见”，保守派团体已经开始开发自有版本的AI聊天机器人。与此同时，埃隆·马斯克(Elon Musk)表示，他正在研发“TruthGPT”，一种“最大限度地寻求真相”的语言模型，将与OpenAI和谷歌创建的“政治正确”聊天机器人形成对比。

诚然，研发公正的（无偏见的）、纯粹基于事实的AI聊天机器人是一种天真的想法，但它在技术上却是不可能实现的。（马斯克还没有透露TruthGPT的细节，可能是因为他忙于思考X和与马克·扎克伯格的笼子里争斗。）为了究其原因，我刚刚发表了一篇文章，该文揭示了政治偏见是如何渗透到人工智能语言系统的。研究人员对14种大型语言模型进行了测试，发现OpenAI的ChatGPT和GPT-4是最左翼的自由意志主义者，而Meta的LLaMA是最右翼的威权主义者。

“我们相信没有任何一种语言模型可以完全摆脱政治偏见”，卡内基梅隆大学的博士研究员陈朴告诉我，他做了本项研究的部分工作，点击这里阅读更多信息。

关于AI最普遍的神话之一是: 这项技术是中立和公正的。然而，这种说法是危险的，它只会加剧人类对计算机的信任问题。事实上，AI语言模型不仅反映了训练数据中的偏见，而且还直接反映出了创造和训练数据的人的偏见。

“众所周知，进入AI模型训练的数据是偏见的主要来源，而我的研究表明：在模型开发的每个阶段都存在偏见。”达特茅斯学院（Dartmouth College）计算机科学助理教授Soroush Vosoughi如是说。

AI语言模型中存在偏见是一个棘手的问题，因为无法真正理解它们产生的原因，消除偏见的过程也并不完美，由于偏见是一个复杂的社会问题，从技术的角度没有简单可行的解决方案。

这就是我坚信“诚信是最好的策略”的主要原因，诸如这类的研究可以鼓励公司追踪和绘制AI模型中的政治偏见，并对客户更为坦诚。例如，可以明确地对用户陈述已知的偏见，从而使得用户对模型的输出持保留态度。

今年早些时候，OpenAI告诉我，公司正在开发定制的聊天机器人，能够代表不同的政见和世界观，允许人们个性化AI聊天机器人,这是沃苏吉(Vosoughi)研究的重点。

正如在一篇同行评议的论文中所描述的那样，沃苏吉(Vosoughi)和他的同事们创建了一种类似于YouTube推荐算法的方法，应用于生成式模型。他们采用强化学习来引导AI语言模型的输出，从而生成特定政治意识形态或去仇恨的言论。

OpenAI使用的技术称为通过人类反馈的强化学习，在发布AI模型之前对其进行微调,沃苏吉(Vosoughi)的方法也采用强化学习来改进模型生成的内容。

在当今多极化的世界里，这种定制既可以带来好的结果又可以带来坏的结果。好的方面，可以用它来剔除AI模型中的不愉快或错误信息，但另一方面，它也可能生成更多的错误信息。

“这的确是一把双刃剑，”沃苏吉(Vosoughi)承认。

更深度的学习

世界币公司刚刚正式成立，为什么它却已经陷入了调查门？

OpenAI首席执行官山姆·奥特曼（Sam Altman）的新项目“世界币”，旨在创建一个名为“世界身份”（World ID）的全球身份系统，该系统依赖个人独特的生物特征数据来证明他们是人类。它已于上周在20多个国家正式推出，但其中有几个人已经在接受调查了。

隐私噩梦：要理解这里的原因，可以阅读“麻省理工学院技术评论”去年的调查报告，该调查发现世界币从弱势群体那里收集敏感的生物特征数据，以换取金钱。更重要的是，该公司在用户不知情的情况下，使用测试用户的敏感但又匿名的数据来训练AI模型。

在本周的《技术官僚》上，关于技术政策的每周通讯中，泰特·瑞安-莫斯利(Tate Ryan-Mosley) 和记者郭艾琳(Eileen Guo)关注到来自去年的调查结果已经发生了变化，如何掌握最新的新闻。点击这里阅读更多信息。

位元和字节

这是已知的第一个女性在面部识别匹配后被误逮捕的案件

去年2月，怀孕8个月的波查·伍德拉夫（Porcha Woodruff）因涉嫌抢劫和劫车而被捕，并被拘留了11个小时，一个月后她的案件被驳回。她是第六个因面部识别匹配而被错误指控犯罪的人。这六个人都是黑人，伍德拉夫是第一位报告发生类似事件的女性。（纽约时报）

当AI系统在撒谎时，又能怎么办？

去年夏天，我写了一篇故事，关于个人数据是如何被收集到数据集中，用来训练AI语言模型。这不仅是一场隐私噩梦,它还可能导致名誉侵害。在报道这个故事时，我和一名研究人员发现：Meta的实验机器人BlenderBot曾称著名的荷兰政治家玛丽耶·沙克（Marietje Schaake）是恐怖分子。而且，正如本文所述，目前，当AI聊天机器人散布关于你的谣言时，几乎得不到任何保护或求助。（纽约时报）

当前，每家初创公司都是一家AI公司,这是处在AI泡沫之中吗？

随着ChatGPT的发布，今年人工智能的炒作一直非常火爆。似乎每个科技兄弟和他的叔叔都创立了一家人工智能初创公司。但在该聊天机器人推出9个月后，目前还不清楚这些初创公司和人工智能技术将如何赚钱，而且有报道称，消费者正开始对此失去兴趣。（华盛顿邮报）

Meta正在创建具有个人角色的聊天机器人，以试图留住用户

老实说，这消息听起来比较烦人。据报道，Meta公司最早将于下个月推出具有不同个性的AI聊天机器人，以提高用户参与度，并收集平台上的更多数据。用户将可以与亚伯拉罕·林肯（Abraham Lincoln）聊天，或者向像冲浪者一样写作的AI聊天机器人寻求旅行建议。但它提出了棘手的伦理问题——Meta将如何阻止聊天机器人操纵人们的行为并可能制造出有害的内容，它又将如何处理收集到的用户数据？

登录阅读全文



免责声明：该内容由专栏作者授权发布或作者转载，目的在于传递更多信息，并不代表本网赞同其观点，本站亦不保证或承诺内容真实性等。若内容或图片侵犯您的权益，请及时联系本站删除。侵权投诉联系： nick.zong@aspencore.com！

陈芝麻 Altium Designer 22 电路设计与仿真实战从入门到精通一书作者

进入专栏

陈芝麻 Altium Designer 22 电路设计与仿真实战从入门到精通一书作者

文章：11篇粉丝：0人

 私信

为何无法构建出无偏见的AI语言模型

更深度的学习

位元和字节

最近文章

热门文章

推荐

最新资讯