英国语音与音频方案供货商XMOS发表专用于机器学习的Xcore处理器核心,从而为人工智能物联网(AIoT)应用打造全新的跨界处理器(crossover processor)。机器学习版Xcore.ai处理器量产成本可望低于1美元。
Xcore.ai基于XMOS专有核心设计建构的第三代产品,专用于端点设备中进行实时的AI推论和决策,还能够执行讯号处理、控制与通讯功能。
该第三代芯片的新亮点在于专为机器学习应用而设计的向量管线功能。它是同类产品中唯一支持二值化(1位)神经网络的跨界处理器。针对端点应用中的超低功耗AI而言,二值化神经网络的重要性正日益提高,因为它们提供了大幅改善的性能和内存密度,而仅适度地折衷一点精度(Xcore.ai仍可支持32位、16位和8位数字)。
Xcore.ai跨界处理器(来源:XMOS)
这让Xcore.ai跻身支持AI功能的新兴端点处理器之列,成为所谓的“跨界处理器”。“跨界处理器”(crossover processor)一词由恩智浦半导体(NXP Semiconductors)创造,形容一种重要的新设备类型,兼具应用处理器(AP)的性能以及微控制器(MCU)的易用性、低功耗与实时操作;透过“跨界处理器”,有助于将AP的性能带到MCU领域,打破高阶MCU和低阶AP之间的技术鸿沟。
XMOS首席技术官Mark Lippett在接受《EE Times》的专访时说:“如果您与客户讨论到『微控制器』(MCU),他们想到的是价格约75美分或更低、性能相对较低以及约为100MIPS的Cortex-M0、M3或M4系列。而‘SoC’可能是采用四核架构A53核心且执行速度达到1KHz的产品。在二者之间还存在很大的差距,例如语音处理器就是一道难解的数学习题,它需要数千MIPS。因此,在二者中间这个真正重大的应用领域之间还存在着很大的空白,应该为其定义一个新的名称。”
Xcore.ai跻身新兴的AIoT跨界处理器之列(来源:XMOS)
语音接口
XMOS于去年7月发布的第二代产品XVF3510是一款语音接口ASIC,但在该芯片底层同样基于该公司专有的Xcore设计,并随附韧体出货。其基于XVF3510的远场语音解决方案参考设计能够满足亚马逊(Amazon)的Alexa语音服务要求。
鉴于XMOS长期在语音领域的耕耘,Xmos.ai芯片理所当然地最初将针对需要AI用于关键词侦测或词典搜寻功能的语音接口应用。
“明确来说,语音是端点上最重要的AI工作负载,而且可能还会持续相当长的一段时间。但是,为了让语音接口的表现更好,您会发现设备将变得更加多模态。”Lippett描述了一种使用不同类型传感器而使应用更具情境感知能力的趋势,无论是侦测个人的存在还是从某个位置发话,都需要这种情境感知功能。
XMOS首席技术官Mark Lippett
他说:“改善用户体验的机会很多,不只是透过倾听音讯,还可以执行更多功能来实现。”
物联网(IoT)设备中的许多AI应用都取决于隐私、安全和防护的组合,这必须在端点进行处理。例如,如果厨房中只有小孩的话,以语音和雷达开关烤箱的电器安全功能就很重要。
因此,Xcore.ai将为市场提供可用于创建语音接口的工具库,但是Lippett表示,客户已有足够的容量建构自己的系统。它包括一个用于摄影机输入的MIPI接口。
Xcore架构
Xcore.ai芯片可提供高达3200MIPS、51.2GMACC和1600 MFLOPS的性能,并具备1MB的嵌入式SRAM,以及一个用于扩展的低功耗DDR界面。
据XMOS表示,相较于Cortex-M7,虽然可提供相当于Xcore.ai的整合度以及类似的操作频率,XMOS的芯片则使其AI处理性能提高了32倍,DSP性能提高15倍。
Lippett说:“端点应用必须具有性价比,顾此失彼地讨论其中一项性能并没什么意义。我们在价格方面一向具有竞争力,量产后的价格还可以低至1美元。广义而言,我们的成本仅为“Cortex-M7同类产品的一半”,而在性能上更是无与伦比。”
Xcore方块图(来源:XMOS)
Xcore.ai采用XMOS专有的Xcore架构。Xcore本身建立在称为逻辑核心的建构模块上,可用于I/O、DSP、控制功能或AI加速。在每个图块(tile)中有8个逻辑核心,每个Xcore.ai芯片中有2个tile,设计人员可以选择为每项功能分配多少核心。每个tile中还包含内存、算数逻辑单元(ALU)以及与逻辑核心共享访问权限的向量单元。
Lippett说:“重点在于其以一种非常可预测的方式[共享存取]。这就是Xcore的特色。最初,我们希望为软件工程师提供I/O的灵活性,但如果错过期限,硬件就无法兼容。因此,Xcore采用多核心,原因并不在于我们想分担工作负载而加处理——这部份我们已能做到。采用多核心是因为我们希望为应用的特定部份提供专用资源,以便在需要时即已就绪。它采用由下而上的设计,因而可提供这种定时精度。”
将各种不同的功能(I/O、DSP、控制与AI)映像到韧体的逻辑核心,可以创建一种完全以软件编写的“虚拟SoC”。在以下的图示中,一个核心正执行通常以硬件完成的任务(例如I2S、I2C和LED驱动器),有些核心处理神经网络,而其他核心则执行通常以软件完成的任务。在软件中定义这些任务可能速度更快些,更能因应IoT设备的瞬态需求。Lippett说,开发成本也较便宜,让开发商即使是在较小的细分市场中也能打造更经济的解决方案。
Xcore应用(来源:XMOS)
Lippett说:“我们观察市场进展的方式是,市场需要更多样化的功能,而公司必须更快地做出回应。如果不建立一款非常通用的平台,最终可能无法满足任何细分市场的需求,那么也就难以在IoT上押注两年的时间。而今,“藉由Xcore.ai”,就能更轻松地以更低的资本支出让设备更快地投放市场,也能实际针对较小市场少量投注,让这些市场更具经济效益。”
然而,大型MCU制造商也积极进军这一类跨界处理器领域,XMOS将如何与其竞争?
Lippett强调,“当然不会是打造基于ARM的SoC!因为他们确实已经做得有声有色了。要与这些MCU巨擘竞争的唯一方法就是拥有架构的优势。这也正是Xcore在性能方面的固有功能,当然还有灵活性。”
编译:Susan Hong 责编:Yvonne Geng
(参考原文:XMOS adapts Xcore into AIoT ‘crossover processor’,by Sally Ward-Foxton)