百度俞军曾说,用户价值=(新体验-旧体验)-替换成本。当前,语音技术作为一种天然无线的信号,正在以升级、替换的方式逐渐替代遥控器按键、触屏的交互方式。由于语音技术的进化点是可以让我们脱离对手和眼依赖,未来甚至可能作为无线控制信号对设备进行完全控制。
“但能不能完成这样的变革?需要我们有足够确定性,去在用户和设备之间建立语音心理契约,让用户对‘语音’产品建立起足够的信赖及依赖性。” 在中国RISC-V产业联盟、芯原微电子和上海集成电路产业集群发展促进机构共同主办的首届滴水湖中国RISC-V产业论坛上,成都启英泰伦科技有限公司副总裁张来说到,“我们对语音的看法是:听得清,辨得明,用得上,装得起。”
成都启英泰伦科技有限公司副总裁张来
要做到这四点,涉及到“技术”和“市场”两个维度。所谓“听得清”,即把语音加装在设备上可能面临设备自身的干扰、使用环境中的干扰、多人发声干扰等,例如大家都在说话、都在对语音发号施令,该听谁的?“辨得明”就是要面对天南地北的口音、男女老幼的音色都不一样,以及易混易错的命令。“用得上”, 即要有确定的反应能力,还要降低语音产品的成本,并让用户对其性能产生依赖。
CI1122是一颗专用于语音处理的人工智能芯片,也是启英泰伦面向端侧智能语音应用推出的第5款专用AI芯片,自2020年11月发布以来,量产出货已达百万颗量级。可广泛应用于家电、家居、照明、玩具、穿戴设备、汽车等产品领域,实现语音交互及控制。
CI1122内置自主研发的智能语音专脑神经网络处理器BNPU,支持本地语音识别,和内置的芯来科技RISC-V处理器结合可以极低的成本及功耗,在端侧完成高算力的智能语音神经网络运算,从而可不依赖网络云端处理,快速赋能家电设备语音智能化升级。张来表示,在产品设定的交互语境下,CI1122识别准确度不亚于云端识别,且交互响应实时性更优(0.2秒内响应),并能有效应对各种家电使用环境下的噪声干扰。
CI1122具有较高集成度,内置高性能低功耗Audio Codec模块。同时该芯片还集成多路UART、IIC、I2S、PWM、GPIO等外围控制接口,可以在主控芯片供应短缺的情况下,开发低成本高性能的单芯片智能语音离线识别方案,其方案模组体积与价位已接近常规IoT模组水平。这就为语音技术在IoT中的逐渐普及和推广打下了很好的基础,对应了上面最后一条“用得起”。
启英泰伦的语音方案分两种:Inside和Beside。Inside就是存量市场的激活,但这种方式替换成本较高,要加功能就要换一台设备,由此Beside方式应运而生。Beside其实是做语音和红外的桥接,例如空调的红外码接口通过黑色的转换器发送红外码,取电可以直接从空调的插座口上取,还可以防止遥控器找不到。这种思路其实是基于“单点突破”,即“始于微而后成”,这中应用场景是收敛的语音沟通场域,“如果能做透,客户对这项技术的信赖和信任程度就会提升很多,而且对网络、手机、布线的依赖性会减弱很多。无需按键遥控器一样可以做到很好的控制。”张来说到。
除了芯片本身,启英泰伦还有配套的算法,类似语音唤醒、语音识别等功能都可以从启英泰伦自己的AI平台上获取。
资料显示,启英泰伦于2015年11月在成都高新区注册成立,是一家专注于人工智能语音芯片及提供配套应用解决方案的国家高新技术企业。启英泰伦是行业首家同时掌握人工智能语音算法、芯片设计、语音数据处理及训练引擎、软硬件产品应用方案开发全技术链企业,可为用户提供一站式Turnkey服务。
2016年9月,启英泰伦发布行业首款基于深度神经网络专用人工智能语音芯片CI1006,这款芯片能够以比较低的功耗、体积和成本完成在云端才能做的一些语音识别效果。这款芯片很快被美的采用,并在2018年发布了行业首款智能语音微波炉。
自成立以来,启英泰伦已推出5款量产应用的端侧AI智能语音芯片,客户覆盖国内主要家电厂商,以及全国多家知名方案商。公司目前已在集成电路设计技术、本地语音识别技术、语音降噪处理技术等领域申请了100多篇相关知识产权, 未来将继续深耕人工智能语音芯片领域,并持续进行技术创新,助推人工智能语音交互技术在更多应用场景下的商业落地,有效服务国家人工智能战略规划和行业“人工智能+”升级换代。
鸣谢:欧阳洋葱
责编:Luffy Liu