APSPENCORE组织的全球双峰会于2018年11.8-11.9在中国深圳大中华交易广场隆重举行。全球半导体,FPGA主要供应商赛灵思CEO Victor Peng 在峰会上提出了下一代计算的架构:自适应智能(Adaptable Intelligence)。
上个世纪计算机刚刚开始兴起的时候,发展缓慢,可能一个计算机电脑就要用数万个半导体和IC,一台计算机要占用一个庞大的机房。可是现在已经非常发达,IC的发展也非常快。
未来将主要有三大趋势:大数据的爆炸、人工智能的黎明、后摩尔时代的计算。
数据的爆炸,可以说看到算法方面的趋势,比如说在新的计算领域,第一方面是数据的大爆炸,很多是没有良好的结构,比较混乱的、杂乱无章,不管是视频还是相关图像的内容,这就是我们面临的大数据时代。我们需要做的事情是把数据转化为需要的、有用的信息,我们怎么样处理数据变成有用的信息呢?我们需要更大的吞吐量和实时计算,这样才能得到非常高效和有用的数据来支持我们的工作。
大数据的爆炸,让我们看到一个巨大的趋势:人工智能AI。我们现在正处于人工智能的初期发展阶段,我们会看到很多先进人工智能的出现,也有各个行业人工智能的情形、类型,可以说遍及所有行业,人工智能将会改变所有行业的景观,也会对人类生活产生翻天覆地的影响。
大数据和人工智能的发展需要我们有很好的计算能力,对我们的计算机提出更高的要求。我们现在正处于人工智能的初级阶段,未来的发展要面临更多的挑战和压力。我们不仅仅是在应用计算机方面,而且在培训等等方面,也正处在初级阶段,比如说实时的培训等等方面。
另一方面,在过去40年这方面发展非常好,也支持不同行业的发展。这是我们接下来的几年里,看到的三大趋势,后摩尔定律时代的计算是什么样的,还有我们带有加速器的异构计算。可以说相关的元器件它的大小在不断的减小,但是它的功能不断提高。这些元器件也会越来越便宜,运算速度越来越快,这部分我们的业务机会可以说达到几十美元这样的机会。我们不仅仅从技术的角度,而且从经济学的角度也可以看到这方面的发展对我们非常有利。比如2008年的时候,我们回顾2008年,我们可能不会想到技术发展如此之快,我们的元器件会变得如此便宜又高效。芯片世界的周期现在远跟不上创新速度,与此同时我们也要整合在人工智能上的新发展。我们需要不断契合市场的需求,不断提升设计周期,提升计算能力。
面对当前的趋势和问题,赛灵思的答案是什么?这需要不断的发展,要建立普适互联网智能时代,也要进行非常好的基于它能够的设计、理念的创新。赛灵思最初的时候,专注的客户是比较大的客户,比如政府或者大的组织或者经济体,可能这个政府或者一个经济体就用一个系统,这是大型机时代,可以说单位是百万级的。随着不断的发展,整个平台、PC平台不断发展,进入PC时代,可以说单位是上亿级,这时候生产效率得到极大的提升。我们称之为英特网2.0时代。在上世纪八九十年代以及本世纪初的移动时代出现,PC时代已经基本饱和,那时候需要更多的灵活性、需要更高的效率,从微处理器移动到SOC或者从微处理器转向SOC,我们希望实现更高的效率以及更低的能耗。这时候很多设备被连接在一起、连接的规模更大。而当前我们要应对的问题更多,包括语音识别、AI等等。新的计算时代刚刚到来。这个时代将是普适智能的时代。
在这个时代从比较简单的设计发展到非常、非常复杂的设计,一款设计里面有成千上万的单个部件,基础设施在城市、电网等等设计方面都会使用到这样的智能装置。这会带来巨大的变化。因为,基础的设施和架构都会发生变化。用以前的微处理器和SOC可能都没有办法直接应对。在这个新的时代要处理数据,数据非常多,要在架构层面创新,并不是单一的创新,需要在各方面都创新。因此,赛灵思就提出一个概念叫专用领域架构DSA,DSA意味着在每个领域都需要有新的架构,为每个领域都带来新的应用。随着部署更多的产品和更多的设备,随着他们用在具体的场景中,DSA会发挥出巨大的作用。
从2000年到2015年,AI论文发布数量增长非常迅速。另外无线更新,可能是其中一个促进因素,人们可以在汽车上直接使用无线功能来上传很多东西,比如你可以在车上上传软件的补丁或者对文章的更新。这意味着我们的创新必须加速,从部署到上市的时间要更短才能支持这种需求。相信在普适智能时代需要更灵活应变的智能和更好的DSA,仍然要创新、仍然要开发新的功能,这是不可或缺的。基础设施的部署要非常快,赛灵思表示,这需要平台,这些平台需要有适应性的,上面提到的DSA也要逐渐改善,改善现有的状况。
在计算时代的早期,大部分的事情是由CPU做的,后来我们有了异构的架构,有了更多的元器件来处理种种任务,这时候响应时间会更快、执行时间会更短,我们想让整个的应用更加高效,速度更快,我们需要更灵活、更可适应的平台来支持整体应用的加速。而现在我们在开发人工智能的网络,人工智能网络可以使得这一时间更短,但是AI并不是一切。我们在使用AI的时候也不是使用某个神经网络,可能有很多神经网络参与其中。我们过去使用了CPU来做很多事情,而在未来CPU的作用会越来越小。我们希望通过AI网络实现更强的功能。有很多软件可编程的系统可以帮助我们实现更多的可能性,在时延等参数方面实现更高的性能。
使用ASIC为什么不能实现?其实可以实现,但是ASIC支持的应用数量有限。在有些平台我们可以实现很多不同的应用,在软件和硬件方面它们都是可以编成的。FCPA在软硬件方面都可以编程。我们可以看一个例子,我们要建智慧、安全的城市,在基础设施方面、在商业方面、在政务方面,我们都需要让城市变得更智慧,我们需要进行很多、很多的努力来做好城市的建设。我们需要有很多技术,比如图象识别,如果有GPU和CPU的连接,在使用机器学习的算法,那就可以实现非常好的架构,这里CPU和GPU有连接,还有H264的解码和运动分析,通过PCE接口和CNN连接。CNN是卷积神经网络。解码后的信号以及运动分析的信号通过PCIE传输给CNN进行分析,这里的功耗是75W,时延82毫秒,吞吐量4×12fps,如果我们使用CPU FPGA的方案可以把时延降低、吞吐量也降低、功耗也降低,我们将运动分析再移到后面来。
赛灵思的战略是非常清晰的,CEO Victor Peng上任以来建立了清晰的策略:建设更好的数据中心。数据中心可以为我们提供非常强的数据支持,没有数据,未来我们的发展是非常困难的。我们要有非常好的数据存储装置,我们希望在做数据分析的时候能够使得我们使用的分析用的计算机与数据非常近,而不是很远的调取数据,因为这样会降低效率、提高功耗。我们使用FGPA等等。
引领自适应的计算非常重要,我们处在计算的新时代,无所不在的计算或者叫做普适智能时代。除此之外,还会考虑如何加速核心市场的发展。赛灵思也引入新的产品,这里有一款产品时延非常低,可以实现最大性能的推断,在GoogleNet可以实现每秒3万张的推断量。
可以看到RFSoC引领5G发展之路,赛灵思表示取得这些成绩还不满足,还在继续发展更新的技术、更新的产品。
ACAP是自适应计算的下一个里程碑,自适应计算上,ACAP是非常重要的。ACAP是自适应计算的高级平台,赛灵思开发出一个系列Versal,Versal是基础系列,可以用于很多市场,有很多不同的应用,Versal产品中系列是针对不同的应用场景的。大家看到的中档系列,针对连接性进行优化,可以看到不同的加速和工作负载是什么样的。在Versal下面有很多、很多子系列,有AI射频、AI Core、AI边缘、基础系列和旗舰系列等等。赛灵思的平台更好的面向开发者。有多核的SOC,也有AI引擎,这一切如何更好的考虑?我们需要有更多的灵活性面向所有的应用,我们要有可编程的软件,要有更好的平台。
在机器学习方面、推断方面,也考虑到如何降低延时、提高推断性能。这里红色的部分展示的性能差异,大家可能听说过北京有一家AI公司,他们做推断的时候精确度非常高,基本上没有任何的损耗。这对于将来5G通信或许非常重要,在能耗方面他们的能耗非常低,或者说能效非常高。不过有7纳米的Versal可以实现更好的推断性能。使用相同的功耗,赛灵思的加速卡可以在7纳米下实现更高的性能。
赛灵思非常重视中国,希望在这个市场带来一些影响力,在过去1个月时间中其CEO Victor Peng两次来到中国,组织了赛灵思开发者大会,促进整个行业的发展。赛灵思可以提供一个好的平台,这个平台可以带来无限的创意,并使开发者发挥他们的创造性。
希望在这个新的计算时代,可以有更多人做创新,使AI发展更好,也希望赛灵思提供的平台为所有人喜爱,因为我们的平台真的是非常高效、非常优秀的。Victor Peng说。
当前世界与以前大不相同,是万物智能的世界,所有东西都联结在一起,我们需要更加灵活,更加有应变性。这就需要非常好的平台提供支撑,这是不可或缺的。在这个后摩尔时代,赛灵思提出的自适应智能作为下一代计算的架构为我们提出了明确方向。