广告

智能语音浪潮一波未平一波又起

2017-09-14 10:38:40 Moshe Sheier,CEVA战略营销总监 阅读:
随着第二波智能语音浪潮来临,智能扬声器设备制造商必须在功能特性和用户体验之间找到最佳平衡,同时保持具竞争力的价格…
广告

或许您还没有听说过,2017年已经被称为“语音接口年”了。从年初美国拉斯维加斯国际消费电子展(CES)的“语音启动”成为最受瞩目的焦点开始,话题持续延烧到年中在上海举行的世界移动通讯大会(MWC)。这一称号并进一步受到多家因特网和技术巨擘的加持,他们不断加入竞赛行列并推出以智能扬声器为基础的个人语音助理。

美国的智能扬声器

自从2014年亚马逊(Amazon)智能扬声器Echo推出以来,这个市场一直呈指数级成长。根据audioxpress.com,在美国,智能扬声器占家庭音频硬件类别的30%。预计未来几年将持续成长,到2020年将可达到1亿美元的规模,其中75%的美国家庭将拥有智能扬声器。

Google Home扬声器自去年发布后,成功地占据了一定的市场份额,但仍远落后于Echo。根据eMarketer US对2017年的预测,Amazon Echo扬声器将拥有70.6%的市占率,Google Home约达到23.8%,而剩下的市场将分布于联想(Lenovo)、Harman Kardon和LG等市占率更小的参与业者。
20170914-audio-1
图1:技术领域的各大巨擘现正竞相争夺您咖啡桌上的一小块圆形空间 (来源:Reuters/Harman Kardon)

不过,在Apple发布其高价位的高阶扬声器——HomePod后,这个情况即将发生重大变化。微软(Microsoft)也将加入这场竞赛,但它并非打造自家的扬声器,而是即将推出一款名为Invoke的Harman Kardon设备,由Cortana提供支持。今年初,进军该市场的另一重点是Lenovo的Smart Assistant扬声器,它将会是Amazon Alexa的新主人。使用者现在可以选择任何一款由Alexa智能语音服务提供支持、但不一定由Amazon制造的设备产品。Lenovo扬声器的音响系统也将由Harman Kardon支持。

中文智能扬声器为全球1/5人口敞开大门

同时,在中国,阿里巴巴(Alibaba)宣布推出天猫精灵(Tmall Genie) X1,正式进军智能家庭扬声器市场。

Tmall Genie X1It预计不久即将上市,价格大约75美元,比美国各种设备更便宜得多。不过,中国市场本身已经开始竞争了。阿里巴巴的竞争对手之一——在线零售业的后起之秀——京东商城(JD)与iFlytek合作,在去年发布玲珑叮咚系列智能扬声器。

中国搜索引擎巨擘——百度(Baidu)则与硬件公司AiNemo合作,在智能扬声器领域搭建略有不同的选择。这款称为Little Fish的设备是由百度的语音启动操作系统(OS)——DuerOS提供支持。它与迄今讨论的其他产品不同之处在于配备了屏幕和相机。智能机器人可以追踪使用者的脸部,并使用脸部辨识功能验证在线购物。它还可以显示信息和影像,以响应用户的查询。
20170914-audio-2
图2:百度推出配备屏幕和相机的智能扬声器,可以在房间周围对您进行追踪 (来源:Baidu)

这与Amazon Echo产品系列的最新产品Echo Show有点类似。但相对于Little Fish,Echo Show并不能移动,所以无法在房间周围进行追踪。您甚至也无法手动更改屏幕的角度,所以它的限制非常多,但这是美国第一款配备屏幕的智能扬声器。因此,当我们看到越来越多模仿原始Amazon Echo的产品出现时,Amazon本身正开始转向新功能。

技能组合是语音助理的差异化关键吗?

这个市场的竞赛还处于早期阶段,而产品彼此间的相似程度令人惊讶。除了些微的设计不同,设备的外观几乎没有任何差异,只有在内部出现一些更有趣的区别。麦克风的数量存在相当大的变化,从Google Home中只用了两支麦克风(执行远场语音提取的最小要求),到Lenovo Assistant支持高达8支麦克风。扬声器的数量和质量也不尽相同,在Lenovo和Apple即将推出的产品中,尝试透过多声道高音扩音器、室内校正和音频波束成形等技术,从而将音频提升到大幅超越Amazon和Google现有产品的水平。

扬声器背后的智能控制差异更为明显。人工智能(AI)平台在技能组合和可执行的任务方面并不完全相同。Alexa已经取得了15,000多种技能,远胜于任何竞争对手的产品。根据Voicebot的说法,Google Home排名第二,仅支持378种技能。就技能组合而言,未来可能会是一大卖点以及差异化的因素。

另一个重要方面是基础AI平台的“智能程度”。能够对话、理解语言的情境以及回答后续问题就是很好的例子。衡量这一点比计算技能更困难,但Google Assistant在这方面可能就超越Alexa了。一般来说,像Google和百度等搜寻巨擘可以取得大量的数据,在深度学习方面更有优势,这将有助于其日后的发展。

目前,AI平台和实体扬声器已经整合了,很快地就会发生变革。由于Amazon和Google已经向第三方设备开放其服务了,因此,扬声器硬件本身的设计对任何人都是开放的。只需藉由足以实现远场语音拾音功能的解决方案,任何设备都可以透过API连接到所选择的个人助理,并提供智能语音服务。这为芯片和设备制造商开启了大量的机会来建构智能扬声器硬件,以把握任何市场机遇。至于Apple,同样地,该公司仍将Siri保留在自家硬件中。

打造具成本效益的低功耗SoC方案

综合上述的所有要点,我认为这标志着第二波智能扬声器的冲击。在第二波周期,设备制造商使用相同的几种个人助理平台,致力于降低成本并实现大量市场。为此,他们必须在功能特性和用户体验之间找到最佳平衡,同时保持具竞争力的价格。此外,市场领导厂商将尝试提升平台的技能和智能程度,并推出新的特性功能(如屏幕和相机),以取得不同程度成功。就像十年前的智能手机平台战争一样,尽管导致许多变化,最终将融合于消费者的达尔文“适者生存”选择。

语音接口市场正蓬勃发展中,预计还有更多的公司加入。观察Lenovo扬声器和Invoke也将特别有趣,因为这象征着语音助理本身及其消费应用产品之间“分道扬镳”的开始。

EETC wechat barcode


关注最前沿的电子设计资讯,请关注“电子工程专辑微信公众号”。

 

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
  • 将电流感应集成到宽禁带电源转换器的挑战 由于在满足所有要求方面存在不同的权衡,因此很难采用一种适用于所有情况的电流检测方法。
  • 2024年Q3传感器市场:近9成上市企业同比正增长! 整体来看,2024年前三季度中国传感器上市企业经营业绩整体表现良好。其中,韦尔股份、华工科技、思特威、汇顶科技等营收和净利润均有显著增长。韦尔股份则以近190亿元营收、24亿元净利润独占鳌头。
  • 飞凌微深耕车载图像处理,以端侧SoC与感知融合赋能高阶智驾 在未来发展规划上,邵科表示,飞凌微将深耕图像处理应用能力,不断拓展机器人、物联网等应用领域,“未来,飞凌微将持续开发一些新的系列SoC产品,能够跟图像传感器在应用方案上形成更紧密的结合,满足端侧更多的应用落地场景。”
  • 华为新专利脑机接口芯片曝光,或意在攻关信号传输难题 信号传输是脑机接口的技术难点。华为这次新专利应该是在攻克这一技术壁垒,期待能带来突破,让脑机接口技术实现场景化应用。麦肯锡预测,到2030年全球脑机接口在医疗产业应用的潜在市场规模有望达到400亿美元,到2040年有望达到1450亿美元。
  • 晶圆级脉冲激光沉积将改变游戏规则 一项技术要想产生广泛的影响,它不仅要解决短期的挑战,还应该超越现有技术的进步,为未来的创新打开大门。这就是我们对泛林集团(Lam Research)今年早些时候推出的全球首个用于半导体量产的脉冲激光沉积(PLD)技术的描述。
  • 晶合集成与思特威首颗集成1.8亿像素全画幅CIS芯片成功试产 当今这个数字化时代,图像传感器技术的发展对于摄影、安防、医疗等多个领域的重要性不言而喻。近日,合肥晶合集成电路股份有限公司与国内设计公司思特威联合宣布,他们共同研发的首颗1.8亿像素全画幅(2.77英寸)CMOS图像传感器(CIS)已成功试产。
  • “一碰交互,共触未来”ITMA峰会盛大 目前,智能终端NFC功能的使用频率越来越高,面对新场景新需求,ITMA多家成员单位一起联合推动iTAP(智能无感接近式协议)标准化项目,预计25年上半年发布1.0标准,通过功能测试、兼容性测试,确保新技术产业应用。
  • 中科院微电子所在忆阻神经-模糊硬 中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案,首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……
  • 直角照明轻触开关为复杂电子应用提 C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置,为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。
  • 投身国产浪潮向上而行,英韧科技再获 投身国产浪潮向上而行,英韧科技再获“中国芯”认可
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了