广告

拆解Amazon Echo:它的语音控制有何独到之处?

时间:2016-11-09 12:23:00 作者:Junko Yoshida 阅读:
无论你称它为智能麦克风、虚拟数位助理、家用机器人、语音控制或R2-D2,亚马逊(Amazon) Echo可说是目前最热销的物联网(IoT)装置,这一类以语音为基础的产品正迅速掘起...
广告

相较于Echo,最新的第二代Echo Dot的价格从89.99美元调整为49.99美元,并将于本月在美国上市销售。

Amazon Echo(及其随后推出的Dot)开辟了一个新的市场,让装置供应商能够在语音撷取、提高麦克风音讯解析度、更先进的背景杂讯过滤、更好的音场侦测与稳定连线能力等方面展开竞争,以提供更佳音讯品质。

Amazon16110901
Amazon Echo (左)及其第二代产品Dot

而像XMOS等公司虽然自家晶片并未用于Echo中,但也瞄准了这个新的语音界面市场。XMOS行销与业务发展副总裁Paul Neil表示,“物联网目前正是一场快速移动的盛宴。为了控制IoT装置,语音是最自然的使用者界面。”

Neil说,由于融合了“传统的微控制器(MCU)性能、嵌入式DSP以及灵活的I/O组合,使得我们的技术成为语音界面的理想选择。”

然而,硬体装置之间的战争只是构成整个智能麦克风/扬声器市场的一部份。IHS Markit连网家庭资深分析师Paul Erickson强调,“真正的竞争变数来自云端。”

为了追求更“聪明”的智能麦克风(能够处理複杂的查询和随机问题),云端服务领域的竞争越来越激烈。 Google预计将于今年年底推出Google Home与Google Assistant (Google Now的新版本),并藉此进入这个市场。Erickson表示,“而且市场上盛传苹果(Apple)很可能将在2017年挟其Siri进入这个领域。”

Amazon Echo——这款IoT装置如此热门的另一个原因在于它极具潜力,可实现IoT的重要优点:经得起时间考验(Future-proofing)。

芯科科技(Silicon Labs)软体副总裁Skip Ashton解释,Future-proofing的意思是“确保装置可随时间进展持续添加更多功能特性。”例如,Alexa为Echo提供的语音服务功能一开始有70种,如今已经增加到超过1,700种了。

Echo可以回答问题、阅读新闻、为运动评分、控制灯光、从Amazon网站订购产品以及设定闹铃等。使用者还可以利用该装置向Uber叫车或订购披萨外送等。

“目前Echo大约每两週透过云端更新一次,”Ashton说,“Amazon会在星期五时发送电子邮件给Echo用户发佈新功能, ”而Echo用户“也对于产品的功能持续增加怀抱著期待。”

本地智能

IHS Markit嵌入式处理器首席分析师Tom Hackenberg剖析Amazon Echo对于电子产业带来重大影响的原因:智能麦克风/智能扬声器应用“对于处理器供应商来说极具价值。”

因为这种装置关键之处并不只是提供了“本地智能”。语音界面正普遍应用在广大的市场领域。不只是数位助理市场出现,成为智能型手机App的消费电子装置版本,还有扬声器,也不是它唯一的外形应用。

例如,他解释说,“家庭自动化中心和数位助理可以内建于电视、机上盒(STB)、HVAC/环境控制中枢等等。此外,在车载资讯娱乐方面也存在大量的应用,特别是著眼于其免手持的优点。”

拆解Echo与Echo Dot

透过拆解Echo与Echo Dot并进一步比较后,Hackenberg说,“除了记忆体供应商,我发现Echo和Echo Dot的处理元件并没有明显的不同。”

Amazon161109022
拆解Echo与Echo Dot (来源:iFixit)

根据iFixit所进行的拆解,Amazon Echo採采用:

●三星(Samsung) K4X2G323PD-8GD8 256MB LPDDR1 RAM (挥发性记忆体)

●SanDisk SDIN7DP2-4G 4GB iNAND Ultra Flash (非挥发性储存)

而到了新版的Dot则改用:

●美光(Micron) MT46H64M32LFBQ 256MB (16Meg x 32 x 4Banks) LPDDR SDRAM (挥发性记忆体)

●三星KLM4G1FEPD 4GB高性能eMMC NAND Flash (非挥发性储存)

两款产品使用的处理器则是相同的。在Echo与Dot的核心採用的是“德州仪器(Texas Instruments;TI)的媒体处理器DM3725”,此外,高通(Qualcomm) Atheros QCA6234应用专用标准处理器则用于提供“连接性”。

Hackenberg解释说,虽然记忆体可能稍微影响性能,但记忆体定价是波动的。因此,对于Echo系列的所有产品而言,在其整个生命週期中改变所使用的元件也很平常。

相形之下,“连线模组,尤其是媒体处理器更加複杂,如果不是重大的产品更新,一般并不会改变,”他说。

Hackenberg指出,Atheros处理器专用于作为连接应用标准产品。其设计是以Tensilica客製化XTensa核心为基础,而且“它只做一件事——协调与网路的通讯,以利作业进行。”

Erickson补充说,“连接能力至关重要,因为它涉及哪些资料可被撷取、传送与接收云端资料的速度与可靠度等。由于速度/响应的可用性因素,它直接影响到与扬声器之间的互动有多麽“即时”。因此,Wi-Fi的吞吐量、服务品质(QoS)与范围的改善,都将有所帮助。”

所有的“本地”(local)智能功能是由TI DM3725进行处理。Hackenberg指出,“这是一款专为STB、TV、显示器、视讯游戏系统等各种多媒体应用而设计的系统单晶片(SoC)。”

DM3725是一款以ARM Cortex A8为基础打造的元件,并整合TI的C64x+DSP与3D绘图加速引擎。“Cortex A8是一款成熟且经济型的应用处理器,但又完全足够用于本地执行简单的任务,”Hackenberg表示。

然而,“如果应用变得複杂,而不只是一款扬声器这麽单纯,可能就会有所变化。”

Amazon16110903

Amazon16110904
Amazon NT31P4 Amazon Echo Dot主板 (来源:iFixit)

DSP整合

根据Hackenberg,这颗SoC的关键就在于整合了DSP,甚至可能是GPU。

“在一个典型的设计中,存在多个输入感测器(主要是麦克风)。整个音讯输入首先经DSP高度滤波,使系统快速地理解用户的语音和环境杂讯之间的差异,”他说。

“它甚至能够解读相对于该装置的位置或甚至发话者是谁;它还建立了一种模式,能够经过处理以匹配该模式(通常发送至云端),”他补充说。

但是,GPU做什麽呢?

Hackenberg认为,“对于本地智能,GPU可以用于更简单、但快速且高效的本地模式匹配。”

这可以让装置仍然回应所储存的控制模式,例如“降低音量”、“切换频道”或其他简单的控制,而无需网路连接,他解释说。 “接著,应用核心根据所需提供的回应、启动/关闭所需的输入或控制以及必须显示的内容等条件来执行应用程式。”

麦克风阵列

Amazon Echo和Dot之所以吸引人之处在于它使用了7麦克风阵列。Amazon声称,Echo和Dot由于使用了多支麦克风和波束成型技术,因而“能在整个室内都听到你的声音——即使是正在播放音乐的环境下。”该公司还表示,Echo是一款专业级的调音扬声器,能以360°沉浸式音效充满在整个房间中。

根据IHS Markit负责MEMS和感测器的资深分析师Marwan Boustany表示,Echo採用了楼氏电子(Knowles)的MEMS麦克风。

Amazon16110905
Dot採用7支麦克风阵列

Boustany指出,为声音频率提升其讯号杂讯比(SNR)、匹配和性能,将有助于远场音讯撷取,同时改善语音辨识。

但最终,“演算法才是实现更优质语音辨识的真正关键,”他说,“所谓的『智能』就在于云端可能持续作为关键应用,而本地处理则可以提高对于简单/预定义片语(如Hey Siri等)的辨识能力。”

他以Cypheras为例表示,“这一类的软体供应商将有利于智能家庭系统(如Alexa)中的语音辨识功能。”

Amazon16110906
Amazon Echo Dot (来源:iFixit)

竞争日益加剧

以供应商来看,目前有几家提供微控制器(MCU)和连接用ASSP的供应商可能在此领域展开竞争,包括Apple、博通(Broadcom)、赛普拉斯(Cypress)、微芯科技(Microchip)、恩智浦(NXP)、瑞萨(Renesas)、意法半导体(STMicroelectronics)以及芯科科技(Silicon Labs)等。Boustany表示,”802.11n与BT 4.0的组合并不常见,但有些设计针对较低成本的解决方案或许将会只用蓝牙。

媒体处理器较为棘手。虽然多家行动装置应用处理器供应商都可提供,但对于简单的应用来说成本太高。根据Hackenberg的观察,供应商们可能会选择不提供性能相当的DSP或模式匹配功能。

“我可能会考虑採用Apple Ax、Broadcom BCM7xxxx、海思(Hisilicon) Hi3xxx、NXP i.MX、联发科MT8xxx、意法STiHxxx、高通(Qualcomm)Snapdragon等。当然,TI或许在成本方面具有最佳DSP支援(对于语音辨识至关重要)的优势,但其他的这几家供应商也在不断地缩小差距中。”

XMOS相信该公司将在这个市场上获得动能。对于诸如Echo这一类的语音助理产品,提高性能的关键在于远场语音撷取能力、波束成型与处理速度等。Neil认为,“凭藉著大量的处理能力和嵌入式DSP,我们的XMOS单晶片元件提供了可扩展和差异化的解决方案。”

Amazon16110907
XMOS xCore语音界面案例 (来源:XMOS)


编译:Susan Hong

本文授权编译自EE Times,版权所有,谢绝转载

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
Junko Yoshida
ASPENCORE全球联席总编辑,首席国际特派记者。曾任把口记者(beat reporter)和EE Times主编的Junko Yoshida现在把更多时间用来报道全球电子行业,尤其关注中国。 她的关注重点一直是新兴技术和商业模式,新一代消费电子产品往往诞生于此。 她现在正在增加对中国半导体制造商的报道,撰写关于晶圆厂和无晶圆厂制造商的规划。 此外,她还为EE Times的Designlines栏目提供汽车、物联网和无线/网络服务相关内容。 自1990年以来,她一直在为EE Times提供内容。
  • 老外魔改中国造“荧光灯”手电筒 我又从Aliexpress购买到一款手电筒。与之前购买的其他款式的产品相比,这次的设计稍微好一些。手电筒造型独特,看起来像个荧光灯。
  • iPhone 15 Pro Max 成本更低,或成为苹果最赚钱的手机 iPhone 15 Pro Max 的 BoM成本比iPhone 14 Pro Max 的成本比高出 37.7 美元。业界首款 3nm  A17 Pro、创新的 5 倍长焦摄像头以及重新设计的钛金属中央面板是 BoM 成本增加的主要领域。内存和显示屏幕是成本下降的领域之一。苹果自行设计的零部件占总BoM成本的比例已增至25%。由此,iPhone 15 Pro Max或许成为苹果最赚钱的手机。
  • 拆解小米13 Pro,内部采用澎湃P2充电芯片 小米 13 Pro属于非常典型的三段式结构,拆解并没有太大的难度,好处是可还原性较强。整机共采用4种共22颗螺丝固定。SIM卡托、USB接口套有硅胶圈起防水作用。整机通过液冷管+铜箔+导热硅脂+石墨片进行散热。后置摄像模组占据了内部不小的位置。......
  • 拆解华为、小米、三星折叠机,他们有什么区别? 拆解对比HUAWEI P50 Pocket、SAMSUNG Galaxy Z Flip4、Xiaomi MIX Fold2。这3款折叠屏手机算是较为热门的折叠屏产品了,价格自然也是不低的。最便宜的还是7499的Galaxy Z Flip4,不过也仅有它支持IPX8级防水。
  • 拆解华为 Mate50 Pro:内部布局整齐,无太大结构变化 Mate 50 Pro整机拆解难度中等,可还原性强。采用2种,共23颗螺丝固定。内部是常见的三段式结构,在SIM卡托、USB接口和按键软板处采用硅胶圈保护,能起到防尘防水作用。散热是由导热硅脂+石墨片+液冷管组成的散热系统。
  • 拆解卫星电话欧星XT1100,采用国产GNSS定位芯片 拆解小体积,不配备了伸缩式卫星通讯天线,外形酷似mini版 “大哥大”的欧星XT1100......
  • 全球折叠屏手机快速增长,中国品牌压 • 得益于西欧、关键亚洲市场和拉丁美洲市场的增长,以及中国品牌的持续领先,全球折叠屏手机出货量在2024年第二季度同比增长了48%。 • 荣耀凭借其在西欧特别强劲的表现,成为最大的贡献者,成为该地区排名第一的品牌。 • 摩托罗拉的Razr 40系列在北美和拉丁美洲表现良好,为其手机厂商的出货量贡献了三位数的同比增长。 • 我们预计,头部中国手机品牌厂商的不断增加将至少在短期内抑制三星Z6系列在第三季度的发布。
  • AI网络物理层底座: 大算力芯片先进 AI技术的发展极大地推动了对先进封装技术的需求,在高密度,高速度,高带宽这“三高”方面提出了严苛的要求。
  • 奕斯伟计算DPC 2024:发布RISAA(瑞 奕斯伟计算2024首届开发者伙伴大会以“绿色、开放、融合”为主题,从技术创新、产品应用、生态建设等方面,向开发者、行业伙伴等相关方发出开放合作倡议,加速RISC-V在各行各业的深度融合和应用落地,共同推动RISC-V新一代数字基础设施生态创新和产业发展。
  • 重磅发布:Canalys 2024年中国云渠道 2024年 Canalys 中国云计算渠道领导力矩阵冠军厂商分别是:阿里云、华为云和亚马逊云科技(AWS)
  • 全球第三!全球高端手机市场,华为猛涨80%,苹果坠落正拉开帷幕! 在全球智能手机竞争日益激烈的情况下,谁能在高端市场站稳脚跟,谁就占据了主动权。一直以来全球智能手机市场格局都是,苹果专吃高端,其他各大厂商分食全球中低端市场。但现在市场正在其变化。根据Canalys最
  • 又一芯片大厂终止研发! ‍‍Mobileye 将终止内部激光雷达开发Mobileye 宣布终止用于自动驾驶的激光雷达的开发,并裁员 100 人。Mobileye 认为,下一代 FMCW 激光雷达对可脱眼的自动驾驶来说必要性没
  • 在成都寻“金”,那可是来对地方了 文|德福很多去成都旅游的朋友都有个疑惑——为什么在成都官方的城市标志上看不到熊猫,而是一个圆环?其实这个“圆环”大有来头,它被唤作太阳神鸟,2001年出土于大名鼎鼎的金沙遗址,距今已有三千余年历史。0
  • 《黑神话:悟空》下的科技众生相 刚刚过去的8月,《黑神话:悟空》把国产游戏的热度推上了史无前例的高度。根据VG Insights的数据显示,《黑神话:悟空》总销量已经达到1690万份,面对这泼天的流量,各类厂商也坚决不能放过。但凡跟
  • 成立超30年!天津三星电子注销;同时以8.4亿美元向中国公司出售偏光膜业务! 天眼查信息显示,天津三星电子有限公司经营状态9月6日由存续变更为注销,注销原因是经营期限届满。该公司成立于1993年4月,法定代表人为YUN JONGCHUL(尹钟撤),注册资本约1.93亿美元,
  • 2032年单晶硅市场营收将增至201亿美元! 据市场调查机构Allied Market Research的《单晶硅晶圆市场》报告指出,2022年单晶硅晶圆市场价值为109亿美元,预计到2032年将达到201亿美元,2023年~2032年的复合年均
  • 【光电通信】特种光纤与光纤通信-236页收藏  今日光电      有人说,20世纪是电的世纪,21世纪是光的世纪;知光解电,再小的个体都可以被赋能。追光逐电,光赢未来...欢迎来到今日光电!----追光逐电 光赢未来----来源:通信大讲堂申明
  • 【光电智造】机器视觉三维成像方法及应用  今日光电      有人说,20世纪是电的世纪,21世纪是光的世纪;知光解电,再小的个体都可以被赋能。追光逐电,光赢未来...欢迎来到今日光电!----追光逐电 光赢未来----来源:机器视觉沙龙申
  • 【今日分享】世有伯乐,然后有千里马,谢谢您,我的导师…  今日光电      有人说,20世纪是电的世纪,21世纪是光的世纪;知光解电,再小的个体都可以被赋能。追光逐电,光赢未来...欢迎来到今日光电!----追光逐电 光赢未来---- 鹤发银丝映日月,丹
  • 下线、投产...这3个电驱动项目传最新进展 近日,3个电驱动项目迎来最新进展,包括项目量产下线、投产、完成试验等,详情请看:[关注“行家说动力总成”,快速掌握产业最新动态]青山工业:大功率电驱项目下线9月5日,据“把动力传递到每一处”消息,重庆
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了