2018年6月,Arm把中国业务分拆成了独立公司“安谋(Arm)中国”,这家公司由中资51%控股,把国外的技术创新带入中国,研发更符合中国市场需求的产品。公司成立之初,就确立了3条产品线,分别是:周易AIPU、山海平台安全解决方案、星辰处理器。
2018年11月,在ASPENCORE举办的全球CEO峰会上,安谋中国公布全新人工智能平台“周易”(Zhouyi)。该平台采用完全自主研发的AI处理器AIPU以及SDK,安谋中国还与中国生态合作伙伴共同开发了Tengine人工智能软件框架,适配Arm CPU、Mali GPU和第三方AI处理单元,实现人工智能算力优化。
2020年8月6日,在ASPENCORE集团举办的第二届国际电子产业链资源对接大会上,安谋中国资深AI产品经理杨磊(Alvin Yang)发表《周易AIPU赋能AI多样创新》的演讲,详细介绍了周易AIPU的性能参数,支持的产品类型以及适合的应用场景,并谈了安谋中国在人工智能方面的产品和布局。
安谋中国资深AI产品经理杨磊(Alvin Yang)
Arm芯片出货小目标:1万亿颗
传统上大家对Arm的认识,主要是应用在端侧或者物联网设备、手持设备上。虽然一般的终端用户很难接触到Arm公司,但基本上每个人用的设备中都会有Arm,比如95%的手机都会用Arm架构的主处理器或GPU,另外智能电视、机顶盒等设备,底层也大多采用Arm解决方案。
Arm第一个权重产品是处理器解决方案,除了我们熟悉的应用处理器系列,还面向人工智能在处理器的架构上不断演进和升级。杨磊预计,在未来3-5年内可以通过CPU通用算力平台,在人工智能方向上提升10倍的计算能力。
Arm第二个被广泛采用的是GPU产品,据杨磊介绍,Arm GPU的出货量已经达到一年10亿颗。GPU的本职工作虽然是做3D渲染或实现手机游戏的一些功能,但由于它本身计算能力强大,很多应用也会用GPU通用计算能力做深度学习功能。所以Arm在GPU架构上也不断演进,以增强对人工智能场景的运算能力,“我们的GPU架构,从最早只能支持fp32计算,到现在的新架构可以原生支持fp16的计算,从而使GPU在深度学习领域中也能有成倍甚至接近于10倍的性能提升。”杨磊说到。
据杨磊介绍,截止2018年,基于Arm的芯片解决方案累计已经出货1000亿颗,预计会在未来10-20年达到1万亿颗。
大数据背后大市场,需要专用芯片架构
“这是一个十分巨大的量,端侧芯片会产生大量的数据,可以透过5G通信或者IoT把大量数据回传到云端,云端基于丰富的数据,基于现在的大数据、人工智能技术,会产生更加人性化、为大家服务更好的算法或人工智能应用,又重新下载到本地端,更好的服务于我们的生活。”杨磊说到。
由此可见,AIoT未来是一个非常广阔的市场,而且这个市场是正向循环、不断相互促进的。既然看到这个大的市场,那大家都会想要做点什么,这也是Arm在中国成立人工智能产品线,推出深度学习解决方案“周易”的初衷——不仅专注在手机、IoT关键设备等领域,还要在云端、车载等等其他领域有所布局。
周易的定位不像通用处理器或GPU,其IP是专门面向深度学习设计的一套架构和解决方案,同样也是一个IP盒。比如在SoC维度上,周易可用一个完整的异构平台覆盖全部硬件场景,包括已有的CPU、GPU。
杨磊表示,周易AIPU是安谋中国自主研发,是一套国内从头到尾完全自己设计的解决方案。“它跟Arm CPU架构是两套独立的架构,没有任何联系”,其系统底层是面向深度学习重新定义的指令集,在这个指令集基础上又实现了符合这个指令集的周易人工智能处理单元,也就是周易AIPU,它具有高性能、低功耗和安全的特性。
现在人工智能的应用十分丰富,有各种各样的场景,有视觉为主的,也有语音为主的,视觉又有检测、分类等各种算法在里面,不同的解决方案用的算法也不太一样。杨磊发现,有些算法能力强的合作伙伴会做自定义算子,比较私有化,所以安谋中国在设计周易解决方案时,就考虑到了灵活性和通用性。
“我们的架构中分为两类最重要的功能,一部分叫通用算力,灵活可编程,可以支持各种比较冷门的算子以及用户的自定义算子;另外一部分跟AI公司讲的自研AI解决方案一样,我们把它叫做专用算力,它更多采用的是一种加速方式支持大算力、高密度以及高能效的特性。”杨磊解释道,“周易的架构是把这两部分有机融合在一起,构成了人工智能的解决方案。”
本地语音识别方案落地
周易解决方案适合用于语音场景、视觉场景。视觉场景方面,可在安防、智能家居领域做人脸/图像分析、检测,还能用于手机上的抠图、美颜、背景虚化等。
至于语音场景,现在大部分都是本地采集声学信号,自然语言处理(Natural Language Processing ,NLP)或者自然语言理解(Natural Language Understanding,NLU)功能只能通过网络传到云端解析计算,这主要是受限于传统AIoT设备的算力不够。但因为语音交互时,往往需要能够快速响应,还会涉及到一些隐私问题。在有一些场景信号不好,或是没有网络的场景下,只有本地识别才能有好的用户体验。
杨磊表示,周易的计算能力完全可以胜任本地做自动语音识别(Automatic Speech Recognition,ASR)或者自然语言理解,这样能解决一些实时性和隐私性问题,而低功耗特性也可以满足关键词检出(Keyword Spotting ,KWS)功能的要求。
目前学术界对语音的识别、深度学习方面的应用,有很多新尝试。比如用神经网络的方式实现端到端(End to End)的语音识别,而且不仅是实现识别功能,还把语音的去噪、增强等都实现了,从而达到更高的识别精度。
“用周易方案可以很好的实现这些功能,并且是在本地实现。”杨磊说到。
周易专为智能家居打造的Z1-0701与通用DSP在支持AI性能和能效上的对比
这得益于周易本身可灵活可配置的计算能力,从0.1TOPS一直支持到256TOPS。“不过本地语音场景不需要这么高算力,只需要选一个性价比最高的就好。”杨磊建议到,“我们一般建议合作伙伴用最小配置,0.1-0.2TOPS算力水平就可以很好的在本地做语音功能。”
另外周易属于面向深度学习的专用处理器,原生支持常见神经网络的软件框架,也便于用户或者开发者在上面做算法的移植和部署,和通用架构相比,在面积、成本、功耗上都有优势。
2020年4月,全志科技发布了基于周易AIPU的产品智能语音专用处理器R329,这也是安谋中国耗时两年研发周易AIPU的落地首秀。
据杨磊介绍,全志该产品线系列已经在市面上的智能音箱中大量使用,其他一些合作伙伴的产品也马上会面世。未来安谋中国希望籍由周易人工智能平台,赋能各个行业底层应用解决方案。
责编:Luffy Liu