随着赛灵思Vitis统一软件平台的推出,横亘在各学科领域软硬件开发者之间的壁垒被再次打破,一个支持从边缘到云端的全域开发时代正在到来。

赛灵思(Xilinx)公司决心在未来十年加速可编程器件设计生产力的坚定信念,从2012年颠覆之作Vivado设计套件的震撼登场就开始了。7年内,从Vivado设计套件到SDNet软件定义规范环境,从针对数据中心的SDAccel开发环境到面向SoC/MPSoC嵌入式C/C++应用开发的SDSoC,再到面向云端应用的可重配置加速堆栈和面向视觉导向机器学习应用领域的reVISION堆栈,赛灵思的“软”实力在一步步得到释放和增强。而日前随着Vitis统一软件平台的推出,横亘在各学科领域软硬件开发者之间的壁垒被再次打破,一个支持从边缘到云端的全域开发时代正在到来。 

Vitis是什么?

按照赛灵思大中华区销售副总裁唐晓蕾的说法,Vitis一词由vitality(有活力的)和法文单词Vite(快速的)构成,寓意“至关重要的生命力”。赛灵思方面希望能够通过这样一款标准、开放和免费的工具给开发者带来创新和持久的生命力,另一方面,这也是公司未来成长的基石,希望能够用有生命力的产品带给自身有生命力的成长。

2-1.JPG左起:赛灵思大中华区销售副总裁唐晓蕾;赛灵思软件和人工智能高级经理罗霖

Vitis历经五年、投入总计1000个人工/年而打造。它构建在基于堆栈的架构之上,该架构可以无缝插入到开源的标准开发系统与构建环境,而且最重要的,是它包含一套丰富的标准库,这使得软件开发人员无需深入掌握硬件专业知识,即可根据软件或算法代码自动适配和使用赛灵思硬件架构。

同时,Vitis也不限制使用专有开发环境,而是可以插入到通用的软件开发工具中,并利用丰富的优化过的开源库,使开发者能够专注于算法的开发。换句话说,基于统一的XRT层,Vitis不但支持28纳米之后所有的器件,更是针对所有开发者的工具,软件开发者不了解RTL和I/O的使用,可直接调用Vitis;专注于AI研究的AI科学家可以只调用Vitis AI工具。

3-1.jpg

基础层是Vitis目标平台,该平台由电路板和预编程I/O构成。第二层称为Vitis核心开发套件,覆盖开源赛灵思运行时库,以管理不同域间的数据移动,包括子系统、即将发布的 Versal ACAP内的AI引擎和必要的外部主机。此外,该层也提供编译器、分析器和调试器等核心开发工具,其目的是能与业界标准的构建系统与开发环境无缝集成。

在第三层,8个Vitis库提供400余种优化的开源应用。这8个库分别是:Vitis基本线性代数子程序(BLAS)库、Vitis求解器库、Vitis安全库、Vitis视觉库、Vitis数据压缩库、Vitis计量金融库、Vitis数据库集和Vitis AI库。借助这些库,软件开发者可以使用标准的应用编程接口(API)来实现硬件加速。

4-1.jpg

Vitis平台的第4层,也是最具有变革意义的一层,是Vitis AI。它集成了特定领域架构(DSA),例如与GATK集成用于基因分析的Illumina、与ElasticSearch集成用于大数据分析的BlackLynx、以及当前客户正在使用的专有DSA。DSA提供了针对AI模型的硬件实现,开发者可以使用TensorFlow、Caffe等业界领先框架对其进行配置与编程。Vitis AI提供的工具链能在数分钟内完成优化、量化和编译操作,在赛灵思器件上高效地运行预先训练好的AI模型。此外,它也为从边缘到云端的部署提供了专用API,实现业界一流的推断性能与效率。赛灵思据称很快还将推出另一个DSA(Vitis Video),支持从FFmpeg直接进行编码并提供同样超级简单且功能极强大的端到端视频解决方案。

5-1.jpg

除此之外,赛灵思还在网站上免费提供文档、教程、开源库和应用案例,并发布了专门针对开发者的网站developer.xilinx.com,以架起开发者与专家之间的桥梁。

赋能软件开发人员

赛灵思软件和人工智能高级经理罗霖不同意外界对于Vitis的一些说法,“在Vitis推出之后,Vivado相对来说就会处于更低层次,主要用于对FPGA进行配置控制”即为一例。他回应称,Vitis和Vivado是相辅相成的,如果用一句话来描述,那就是“Vivado是用来做硬件,Vitis是用来做软件的。”对于硬件工程师而言,他们既可以利用Vivado设计套件继续为希望使用硬件代码进行编程的用户提供支持,也可以通过Vitis将硬件模块封装成软件可调用的函数,而且从本质上来说,这个函数也是由Vivado生成的,无非是预先设置好而已,便于提高工作效率。

例如在智慧城市的典型应用场景中,道路上的摄像头会在前端完成一些汽车和行人的特征提取工作,再将其上传至服务器或云端。在该应用开发里,嵌入式开发人员会基于底层的Shell/Runtime和上层的CNN加速库、数据分析和数据加速库来完成开发;算法卡法人员则基于Vitis平台进行Tensorflow模型训练,从而使得所有开发人员能够在统一平台上进行协同工作,提升群体的开发效率。

对软件开发人员来说,他们可以把整个模型算法完全依靠Python和C++在CPU上完成,这时候用Vitis可以达到每秒6帧的性能。但如果只是把AI模型的本身放在DPU中做加速,性能可以从每秒6帧提升到每秒30帧。如果性能还达不到需求,可利用Vitis库提供预处理优化,或是采用某些高级技巧,把性能从每秒30帧逐步提升至每秒80帧。在这一过程中,软件工程师不需要专门插入芯片间隙或者插入数据监测器来获取相关信息,Vitis可以通过详细的分析报告以友好的图形界面方式呈现。

6-1.jpg

既然谈到异构计算,那么特定域处理架构(domain-specific processing architectures)一定是一个无法绕开的话题,毕竟相当多采用特定域处理架构设计的芯片与FPGA一样,均采用了异构设计,两者有何不同?

罗霖对《电子工程专辑》表示,特定领域应用(DSA)可能来自AI、数据库、或者是金融分析等不同领域,对算法和硬件的需求差异极大,开发人员必须要结合器件本身的具体特点去定义DSA。在一个自动驾驶的案例中,客户A需要15毫秒的反应时间,赛灵思就根据VU30P器件和客户算法专门设计了定制化DSA;而面对需要对32通道视频输入做解码的客户B时,只需要针对已有的器件选型定制另一个DSA IP即可,这是自适应计算加速非常好的两个案例。

在回答与英特尔即将于今年第四季度推出的“One API”软件编程框架相比有何差异时,唐晓蕾回答称,无论是One AP还是Vitis所提出的软硬件协同优化,首先都证明“用软件去定义硬件”理念已经是业界的共识,必须要提供灵活丰富的硬件选择给软件工程师,方便他们用高层的API去调用底层的内容。但,“竞争对手是限制在自己的硬件平台上,而赛灵思的开放是双向的,这是两种完全不同层次开放之间的比较。”

Vitis真正的灵感

Vitis真正的灵感应该来自Xilinx在2018年XDF上推出的新型多核异构处理器Versal。Versal自适应计算加速平台(ACAP)整合了标量处理引擎、自适应硬件引擎和智能引擎以及前沿的存储器和接口技术,能为所有的应用提供强大的异构加速功能。不过,无论是在嵌入式应用还是在云服务中,成功使用任何FPGA的关键都是软件工具,要想使FPGA和Versal架构能够得到广泛采用,Vitis异常关键。

还记得赛灵思CEO Victor Peng在2018年初首次访华的时候就曾公开表示,虽然FPGA与Zynq SoC技术仍然是公司业务的核心,但赛灵思今后将不再仅仅是一家FPGA企业,打造“灵活应变的智能世界”将成为其领导下的公司未来愿景。该世界中,赛灵思将超越FPGA的局限,推出高度灵活且自适应的全新处理器及平台产品系列,为用户从端点到边缘再到云端多种不同技术的快速创新提供支持。从这一点来说,具备统一软件架构的Vitis和具备异构计算架构的Versal,显然成为了赛灵思完成新使命的不二载体,这也是为什么赛灵思愿意将Vitis进行开源和免费的原因。

“异构计算是大势所趋。但有异构计算需求的人往往都是软件工程师,我们希望通过Vitis去帮他们解决这种技术瓶颈,这是我们公司一个最大的愿望。”唐晓蕾强调说,在很多领域,创新速度已经超越了半导体设计周期。这意味着,当用户刚收到针对GoogLeNet优化的ASIC或GPU芯片时,GoogLeNet可能已经被新模型ResNet-50取而代之,硬件用户根本无法预测两年后会出现什么样的网络和算法。而目前市场上已有的处理器架构,CPU/GPU/ASSP都只能做到“可编程或自适应”,只有Versal 能够实现“可编程和自适应”。 

7-1.jpg

罗霖的看法是,现在软件定义硬件的趋势已经不可阻挡,不过应用场景是高度碎片化的,不存在统一的标准和要求去定义所谓的场景。而客户需要的是一个生产效率高、灵活扩展性强的平台,可以根据实际应用和工作负载来自动优化软件、硬件和系统。Vitis软件平台的最大优势,是可以根据客户的软件来通过 Vitis平台生成高效率、定制化的硬件,满足其业务的需求。另外,Vitis也解决了统一云端与边缘计算不同场景下的代码部署问题,支持软硬件开发者更有效地利用所有可用的计算资源,从而大幅提高开发效率。

8-1.jpg

当然,如果从市场角度来解读,我们也不难理解赛灵思推出Vitis的背后原因。

截止2019年3月30日,赛灵思营收突破30亿美金大关,5G基础设施、汽车和数据中心是业绩大幅增长的三大驱动因素。虽然传统类型的FPGA在上述三个领域内都取得了出色的成绩,但新推出的Versal更像是一个可以独立运行的完整平台,而不仅仅是作为主处理器的加速器使用。也就是说,Xilinx认识到,把Vitis环境设计成可以支持包括Arm、x86和Power在内的多类型主处理器,是非常必要的。

数据中心的机器学习推理是关键应用之一。在这些数据中心中,算法不断变化,云服务提供商也在走向异构计算平台,比如Amazon的AWS云服务就有许多包括FPGA和GPU在内的异构计算单元。而在刚刚结束的XDF上,赛灵思还宣布获得了微软的Azure云服务供应商业务。

很难想象迄今为止赛灵思在汽车领域已经出货1.6亿颗芯片,他们接下来的目标就是在智能驾驶时代让汽车和机器“看见一切”。但这么做挑战极大,因为需要把所有的传感器,包括雷达、激光、摄像头、夜视等都融合起来,完成实时图像识别与分析,实现最高性能功耗比,还具有复用和扩展优势。此外,还要确保机器-机器间,机器与云端之间的任意互联,以及足够的安全性和保密性。但凭借设计灵活性和低延迟处理能力,FPGA在机器学习的推力加速方面是具备优势的。有报道称,日立汽车系统(Hitachi Automotive Systems)公司正在自己的Level 2+ ADAS系统中使用赛灵思FPGA芯片并有意继续使用Versal设计。

另一个需要自适应计算的领域是5G,这对从RF前端到核心路由均有布局的赛灵思特别重要。以大规模MIMO阵列中的16x16天线矩阵为例,为了能够实现光谱复用,就必须要能够通过先进计算和机器学习对波束形成进行优化,并针对不同应用场景实现自适应学习。

结语

所有这些关于芯片架构的新想法都是由于摩尔定律的放缓而产生的。当我们再也不能单纯依靠工艺改进来使芯片更快、更低的功率和更便宜时,就需要新的体系结构来提供先进处理功能以面对挑战性的工作负载。面对十倍于硬件从业者的软件开发人员,赛灵思这一独特的解决方案有望让更多主流程序员以更轻松的心态面对和使用硬件。

本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
Rapidus将与博通合作分享其2纳米制程芯片原型,并推动芯片生产的外包。一旦博通确认了芯片性能,Rapidus将能够向博通的客户提供芯片。
尽管Imagination在RISC-V领域取得了一定的成就,但公司似乎认为继续投入资源于RISC-V处理器核心的开发并不符合其长期战略目标。Imagination决定终止其基于RISC-V指令集架构的GPGPU内核的研发工作,并将重心转向其擅长的GPU和AI领域......
Ken Glueck认为,美国2800亿美元的芯片法案所取得的成就,将被出口管制框架夺走,“因为在一项IFR中,它成功地将美国公司的全球芯片市场缩小了80%,并将其交给了中国。”
Intel在CES上发布了面向笔记本的酷睿Ultra 200H, 200HX, 200U系列,基本完善了这一代酷睿Ultra处理器产品线...这也是面向高性能笔记本的酷睿Ultra二代处理器初次亮相。
英特尔临时联席CEO Michelle Johnston还表示,“英特尔会在2025年及以后继续增强AI PC产品组合,向客户提供领先的英特尔18A产品样品,并在2025年下半年量产”。
NVIDIA刚才在CES上发布了GeForce RTX 50系显卡,据说这一代的5070就能达到上代4090的性能水平...
• 目前,iPhone在翻新市场中是最热门的商品,并将长期主导着翻新机的平均销售价格。 • 全球翻新机市场持续向高端化发展,其平均销售价格(ASP)现已超过新手机。 • 新兴市场是增长的最大驱动力,消费者对高端旗舰产品有着迫切需求。 • 由于市场固化和供应链的一些问题限制推高中国、东南亚和非洲等大市场的价格。 • 2024年,这些翻新机平均销售价格将首次超过新手机。
从全球厂商竞争来看,三季度凭借多个新品发布,石头科技市场份额提升至16.4%,连续两季度排名全球第一……
最新Wi-Fi HaLow片上系统(SoC)为物联网的性能、效率、安全性与多功能性设立新标准,配套USB网关,可轻松实现Wi-Fi HaLow在新建及现有Wi-Fi基础设施中的快速稳健集成
其中包含Wi-Fi 7和蓝牙5.4 模组FME170Q-865、Wi-Fi 6和蓝牙5.4 模组FCS962N-LP、Wi-Fi 6和蓝牙5.3模组FCU865R 、独立Wi-Fi和蓝牙模组FGM840R、高功率Wi-Fi HaLow模组FGH100M-H……
大疆发布DJI Matrice 4T旗舰无人机,售价38888元。该无人机可用于电力巡检、应急抢险、公共安全、水利林业监测等众多应用场景。DJI Matrice 4T的镜头模组拥有“六个眼”,除了广角
今天推荐的视频介绍了单片机(MCU)和数字信号控制器(DSC)之间的差异、Microchip DSC的单核和双核架构、DSC的应用示例以及可将您的设计推向市场的开发资源。更多更全视频尽在Microch
01周价格表02周价格观察硅料环节本周硅料价格:N型复投料主流成交价格为40元/KG,N型致密料的主流成交价格为38元/KG;N型颗粒硅主流成交价格为35元/KG。供给动态头部料企继续推进减产策略,月
点击蓝字 关注我们SUBSCRIBE to USImage: The Verge据悉,OpenAI已经制定了成为一家营利性公司的计划。在近日发布的一篇博客文章中,OpenAI的董事会表示,将把公司现有
随着Mini/Micro LED技术发展和小间距产品成熟,LED显示行业在更多细分场景下的高增长潜力正在加速释放。Mini LED背光市场自2021年进入起量元年后,年复合增长率达50%;Micro
日前,微信安卓版迎来8.0.56正式版更新,这是2025年首次版本更新。关于更新内容,依然是那9个字:“修复了一些已知问题”。虽然官方没有公布具体更新内容,但体验后发现,新版增加了朋友圈视频倍速播放等
  在千级电子净化车间中设置通风系统时,需要综合考虑多个因素,包括洁净度要求、换气次数、气流组织、空气处理、温湿度控制以及节能与环保等。以下是合洁科技电子洁净工程公司的一些具体的设
戴尔科技AI PC产品组合助力终端用户释放创造力并提高工作效率。 戴尔科技统一旗下产品组合品牌命名,旨在帮助用户更轻松、快速地找到相匹配的PC、配件及服务。 搭载英
1月8日,艾比森、聚灿光电先后发布2024 年度业绩预告。在大环境变动的影响下,两家企业呈现出不同的表现,然而,它们各自的亮点表现都在一定程度上反映了市场需求的变化。如艾比森在海外市场呈良好增长态势,
点击蓝字 关注我们SUBSCRIBE to US如果你听说过深度伪造(deepfakes),即人们做着从未做过的事或者说着从未说过的话的高度逼真视频,你可能会认为这是一种可疑的技术发展成果。例如,它们