大部份的人可能会发现我们现在都被迫使用一些安全功能来存取电脑、智能手机以及其他装置。而且,要登入各个不同的网络帐号(毕竟,每个人都有好几个),经常比登天还难。
我自己都记不得究竟拥有多少帐号和密码了,光是用想的就让我要喷泪了。而且,我真的很不喜欢把时间浪费在笔记本电脑和智能手机的那些指纹辨识侦测器上。如果每一次都能一触即开,那当然没什么问题,但当你被迫一而再、再而三地尝试后,这些装置才心不甘、情不愿地被迫开始工作,那真的几乎要让我崩溃了。
期望有一天,我所使用的任何系统或网站只要看着我或听到我说话,就可以对它自己说:“这是伟大的Max本人没错,从他那高贵的外表和惊人的时尚感就可以确定了。我很荣幸能让他充份利用所有的应用程式和资料……”
你还记得吗?记年前我写了一篇有关Sensory TrulySecure技术的专栏文章——《生物特征辨识技术结合语音与视觉》。当时我在文中提到,“结合语音辨识与人脸辨识,可提供最先进的安全解决方案”。
TrulySecure是一种不必依靠云端连接的装置上生物辨识系统。当然,有许多的科幻小说都描述过类似的技术,包括用某个人的照片取代本尊来骗过系统。TrulySecure则是寻找足以象征某个生命、呼吸的个体等微弱的身体动作来解决问题。
那么,声纹认证(voice authentication)呢?假设你的朋友们三更半夜来敲门,你问道:“是谁?”他们回答说:“是我!”即使只从这两个字,你或许就能知道你的访客是谁。而今...
我最近听说了一家加拿大人工智能(AI)新创公司Lyrebird。该公司致力研发新一代的语音分析与产生技术,并计划提供给嵌入式(或其他)系统开发商。
起初,这一切似乎都是相当单纯的。您可以从数千个预定义的声音中进行选择,也可以为特定应用设计独特的声音。甚至还可以控制所产生的声音,使其表现出幸福、愤怒、同情以及压力等各种不同的情感。
然而,当我们了解到Lyrebird基于深度学习/神经网络的系统能够分析短至1分钟的声音,而且还能用来产生独特的密钥时,事情似乎就开始变得令人不安了。毕竟,这种密钥接下来还可用于产生任何语音、模拟其对应的声纹,甚至再加上任何设计过的情绪等。
Lyrebird的开发人员们还计划提供一种语音API,可聆听人们说话或进行录音,并产生相关的密钥。还有另一种API可让使用者利用所需的声音产生任何语音或对话。例如,Lyrebird官网上的展示页。另一个例子是川普(Donald Trump)、欧巴马(Barack Obama)和希拉蕊(Hillary Clinton)之间的虚拟对话。
(来源:lyrebird.ai)
我们仍处于这项技术的早期发展阶段,还有很多工作尚待完成,但目前看来肯定会给人一种即将实现的感觉。毕竟它所带来的含义与影响,远远超过基于语音的生物辨识对于安全的威胁。
但你还记得1984年上映的电影《魔鬼终结者》(Terminator)吗?当时由阿诺·施瓦辛格(Arnold Schwarzenegger)扮演来自未来的生化人,穿越时空来到1984年并试图杀死莎拉·康纳(Linda Hamilton扮演),而莎拉尚未出世的儿子约翰·康纳有一天将会成为救世主,组织人类抵抗军在末日后(post-apocalyptic)对抗天网及其统领的机器军团。
此时我所想到的是魔鬼终结者杀死了莎拉的母亲后,当莎拉还不知道魔鬼终结者模仿受害者的能力时,她试图透过电话与母亲联繫,但魔鬼终结者完美地模仿了母亲的声音。当时我看到魔鬼终结者的嘴唇移动,听到的却是一个女人的声音出现—— 完美同步——那场景不禁让我不寒而慄;即使现在…我也正在发抖!
一旦像Lyrebird这样的技术变得广泛可用,当有人打电话给我们时,该如何确定我们实际上是在跟谁说话呢?还有像执法机构窃听电话取得的录音呢?这些经常被用来定罪罪犯和恐怖分子。而今,在某些情况下(例如缺少视讯时),辩护律师应该可以针对磁带上的声音是否确实属于客户而提出合理的怀疑。
或者,政治家呢?假如有人发布了一个听起来像某位政治家自己认罪的录音档,我猜很多人会幸灾乐祸吧?
针对这个主题探讨得越多,会让人变得越恐惧。你觉得呢?你对上述的讨论有什么想法?除了我所提到的,你还想到哪些可能的应用——无论是好的还是黑暗的一面?
编译:Susan Hong