OneAPI:天下大同

电子森林 2020-01-11 23:10

点击蓝字,关注老石谈芯


OneAPI是英特尔在生态布局中最重要的一环,这已经不是什么秘密了。早在2018年底举行的英特尔架构日上,英特尔的芯片首席架构师Raja Koduri就对外公布了公司正在着力研发的一件“大事”:一个名为OneAPI的软件编程框架。


OneAPI相关的技术资料和编程指南,已上传至知识星球“老石谈芯-进阶版”,请在文末扫码进入星球查看。


(图片来自anandTech)


OneAPI:梦想照进现实?


顾名思义,OneAPI旨在提供一个适用于各类计算架构的统一编程模型和应用程序接口。也就是说,应用程序的开发者只需要开发一次代码,就可以让代码在跨平台的异构系统上执行,底层的硬件架构可以是CPU、GPU、FPGA、神经网络处理器,或者其他针对不同应用的硬件加速器等等。


OneAPI的口号是“No transistor left behind”,老石把它翻译成“晶体管一个也不能少”,这也很形象的总结了OneAPI的终极目标。



很多人在看到OneAPI之后的第一反应,都是三个字:不可能。有些略显极端的媒体甚至认为,OneAPI已经超出科幻小说的范畴,实在难以置信。


这些怀疑的声音并非毫无依据,应用程序的跨平台优化一直是业界研究的热点和重点之一。而OneAPI希望一次性解决四个硬件架构的异构编程问题,无异于在游戏开始就选择了地狱难度。


梦想还是要有的,万一实现了呢?


对于大多数应用程序的开发者来说,使用高级语言编程已经成为了再平常不过的事情。试想一下,你上一次写C++或Python、并需要知道特定处理器指令的操作码是什么时候?


事实上,现有的高级语言编译器已经很好的将程序开发与底层的计算机体系结构分离开来。这使得应用程序开发者可以专注于算法和应用的开发,而无需关心太多底层的CPU究竟如何实现程序。


然而,随着应用的复杂性不断增加,对算力的要求也逐渐加大。此时,单纯依靠堆积CPU内核已经无法满足应用程序对于性能、实时性、功耗、成本等等的要求。人们开始使用越来越多的非CPU计算单元,比如GPU、FPGA、以及各种针对不同应用而开发的专用芯片等。这些硬件加速器与CPU一起组成了复杂的异构平台。


为了发挥这个异构平台的最大性能,开发者需要深入了解底层硬件的体系结构,以及一系列的特定开发手段和技巧,以便针对性的利用各个异构单元的优势。


拿FPGA来说,如果按开发软件的思路去开发FPGA硬件,比如使用了各种循环嵌套、多层条件分支等等,恐怕只会得到一个连时序都无法收敛的FPGA设计。同样的,如果想用GPU做一些加速运算,那么最好在团队中有人对CUDA或OpenCL等有丰富的经验,否则就有可能白白消耗了GPU的高功耗而收效甚微。


这里只有一个问题:对于普通的软件工程师或算法工程师而言,了解和掌握这些硬件相关的开发知识几乎是不可能的


而这正是OneAPI希望解决的痛点(引自英特尔):


“OneAPI 提供一个通用、开放的编程体验,让开发者可以自由选择架构,无需在性能上作出妥协,也大大降低了使用不同的代码库、编程语言、编程工具和工作流程所带来的复杂性”。


OneAPI:HLS的进化形态?


具体来说,英特尔将旗下的芯片架构分成了SVMS四类,即:

  • 标量(Scalar):CPU

  • 矢量(Vector):GPU

  • 矩阵(Matrix):AI芯片

  • 空间(Special):FPGA



这四类架构分别有各自的优势和适用范围,同时也有着各自的编程模型和方法。


以FPGA为例,FPGA的硬件可编程性一直是它最主要的特点,也是与其他硬件加速器相区分的重要特性。然而,对FPGA进行编程远远没有听起来那么简单,这在老石之前的文章中也详细介绍过多次。其中最大的难点,就是要使用硬件描述语言(HDL)对电路行为进行建模,而且这种建模往往有着比较低的抽象程度


也就是说,FPGA开发者需要将待实现的算法进行分解、并行化、设计流水线,使其成为一个个数据通路或控制电路,同时还要设计数据的存储和读取方式、各种时钟域的同步、进行时序收敛等诸多优化,以符合系统的功耗、吞吐量、精度、面积等需求。这还不包括电路仿真、调试,以及在软件层面需要做的一系列工作。


这样,为了做出一个真正优化过的FPGA设计,往往需要一个有着丰富设计经验的团队协同合作。而就算有这样的团队,在处理一个再常见不过的for循环嵌套时,都可能花费长达数月的时间进行FPGA的硬件实现与性能调优。只需要看一下过去几年里,各类国际顶会和期刊上有多少关于FPGA循环展开与优化的论文就可见一斑了。


为了应对FPGA的设计复杂度过大的问题,业界通常有两种方法:第一,尽量将优化过的硬件设计封装成IP,让使用者直接调用。第二,使用诸如高层次综合(HLS)的方法,直接将高层语言描述的模型转化为FPGA硬件。


HLS一直是FPGA业界发展的重要方向,几乎没有之一。老石在之前的文章《高层次综合 – 解锁FPGA广阔应用的最后一块拼图》中曾经详细分析过,这里不再赘述,有兴趣的读者可以参考那篇文章。



HLS的主要问题是,它设计的初衷是为了硬件工程师服务,而非软件和算法开发者。因此,起码到目前为止,在业界取得成功的HLS工具都需要使用者有着丰富的硬件知识。在数字电路工程师手中,HLS工具已经被证明可以极大的缩短设计周期,有时甚至可以得到近似或优于人工优化过的RTL代码。然而对于软件工程师,HLS就好比让C罗去湖人队打篮球,固然噱头十足,但很难得到令人满意的成绩


OneAPI在很大程度上可以看做是HLS的扩展,但它的主要目标受众则是软件和算法工程师,这也将成为OneAPI与其他HLS工具的最主要区别。OneAPI提供了一个统一的软件编程接口,使得开发者可以随意在底层硬件之间进行切换和优化,而无需太多关心具体的电路结构和细节。



DPC++语言与硬件加速库


具体来说,OneAPI的核心是一个名为Data Parallel C++(DPC++)的编程语言。DPC++本质上是C++的扩展,增加了对SYCL的支持。


SYCL由Khronos组织开发,它是一个在OpenCL上的C++抽象层,使得用户可以直接用简洁的C++对GPU等进行开发,而无需被OpenCL限制。


不过,有关DPC++本身的资料目前还比较有限,尚不清楚其具体的开发方法、以及如何对异构系统进行编程。待具体实例出现后,老石再进行详细解读。



除了编程接口外,OneAPI还会包含一个完整的开发环境、软件库、驱动程序、调试工具等要素,并且这些加速库都已经针对底层硬件进行了优化设计。


这种基于优化过的加速库的设计,和赛灵思的Vitis系统有着异曲同工之妙,而这也恰恰代表了业界发展的方向。现如今,生态为王,为了掌握生态和开发者,就必须尽可能多的提供各类开发库和IP,以便开发者专注于应用开发,而无需重复造轮子。


(图片来自英特尔)


为了支持SVMS四大类硬件架构,OneAPI实际上给自己设置了非常高的目标。英特尔已经在2019年四季度发布了OneAPI的开发者测试版。除了基本工开发工具包之外,英特尔还发布了针对高性能计算(HPC)、深度学习、IoT、以及视觉和视频等四种领域专用的开发工具包,以期为这些特定的应用进行针对性的优化。在当前的版本中,开发者仍然需要在SVMS四大类中手动指定目标器件类别。但除此之外,OneAPI就会自动对目标器件的子类别进行优化。


结语


兵法云,兵马未动,粮草先行。在技术进步日新月异的当代,各类AI芯片、硬件加速器不断涌现,异构计算已经成为整个行业最重要的趋势。针对这些层出不穷的新硬件,则更应该“架构未动,软件先行”。作为芯片厂商,单纯提供芯片产品已经无法满足市场和使用者的需要,只有同时提供硬件和软件生态,才能在激烈的竞争中杀出一席之地。


老石认为,OneAPI是英特尔当前最具有战略意义的生态布局。相信有了诸如OneAPI之类的高层设计工具,软件工程师和算法专家们就能进一步释放包括FPGA在内的异构系统的底层算力。至于OneAPI未来的表现如何,让我们拭目以待。


OneAPI相关的技术资料和编程指南,已上传至知识星球“老石谈芯-进阶版”,请在文末扫码进入星球查看。


(注:本文仅代表作者个人观点,与任职单位无关。)




往期精选



什么是FPGA工程师的核心竞争力

FPGA在人工智能时代的独特优势

赛灵思新一代计算平台ACAP技术细节全揭秘

英特尔10纳米Agilex FPGA核心技术全解读


更多芯片与FPGA技术解读,欢迎加入知识星球:“老石谈芯-进阶版”,一个关乎技术与观点的互动社区。


硬禾小帮手 -硬件工程师的设计助手

硬禾学堂 -硬件工程师的在线学习平台



电子森林 讲述电子工程师需要掌握的重要技能: PCB设计、FPGA应用、模拟信号链路、电源管理等等;不断刷新的行业新技术 - 树莓派、ESP32、Arduino等开源系统;随时代演进的热点应用 - 物联网、无人驾驶、人工智能....
评论 (0)
  • 引言在语音芯片设计中,输出电路的设计直接影响音频质量与系统稳定性。WT588系列语音芯片(如WT588F02B、WT588F02A/04A/08A等),因其高集成度与灵活性被广泛应用于智能设备。然而,不同型号在硬件设计上存在关键差异,尤其是DAC加功放输出电路的配置要求。本文将从硬件架构、电路设计要点及选型建议三方面,解析WT588F02B与F02A/04A/08A的核心区别,帮助开发者高效完成产品设计。一、核心硬件差异对比WT588F02B与F02A/04A/08A系列芯片均支持PWM直推喇叭
    广州唯创电子 2025-04-01 08:53 179浏览
  • 北京贞光科技有限公司作为紫光同芯授权代理商,专注于为客户提供车规级安全芯片的硬件供应与软件SDK一站式解决方案,同时配备专业技术团队,为选型及定制需求提供现场指导与支持。随着新能源汽车渗透率突破40%(中汽协2024数据),智能驾驶向L3+快速演进,车规级MCU正迎来技术范式变革。作为汽车电子系统的"神经中枢",通过AEC-Q100 Grade 1认证的MCU芯片需在-40℃~150℃极端温度下保持μs级响应精度,同时满足ISO 26262 ASIL-D功能安全要求。在集中式
    贞光科技 2025-04-02 14:50 92浏览
  • 随着汽车向智能化、场景化加速演进,智能座舱已成为人车交互的核心承载。从驾驶员注意力监测到儿童遗留检测,从乘员识别到安全带状态判断,座舱内的每一次行为都蕴含着巨大的安全与体验价值。然而,这些感知系统要在多样驾驶行为、复杂座舱布局和极端光照条件下持续稳定运行,传统的真实数据采集方式已难以支撑其开发迭代需求。智能座舱的技术演进,正由“采集驱动”转向“仿真驱动”。一、智能座舱仿真的挑战与突破图1:座舱实例图智能座舱中的AI系统,不仅需要理解驾驶员的行为和状态,还要同时感知乘员、儿童、宠物乃至环境中的潜在
    康谋 2025-04-02 10:23 76浏览
  • 文/郭楚妤编辑/cc孙聪颖‍不久前,中国发展高层论坛 2025 年年会(CDF)刚刚落下帷幕。本次年会围绕 “全面释放发展动能,共促全球经济稳定增长” 这一主题,吸引了全球各界目光,众多重磅嘉宾的出席与发言成为舆论焦点。其中,韩国三星集团会长李在镕时隔两年的访华之行,更是引发广泛热议。一直以来,李在镕给外界的印象是不苟言笑。然而,在论坛开幕前一天,李在镕却意外打破固有形象。3 月 22 日,李在镕与高通公司总裁安蒙一同现身北京小米汽车工厂。小米方面极为重视此次会面,CEO 雷军亲自接待,小米副董
    华尔街科技眼 2025-04-01 19:39 191浏览
  • 探针本身不需要对焦。探针的工作原理是通过接触被测物体表面来传递电信号,其精度和使用效果取决于探针的材质、形状以及与检测设备的匹配度,而非对焦操作。一、探针的工作原理探针是检测设备中的重要部件,常用于电子显微镜、坐标测量机等精密仪器中。其工作原理主要是通过接触被测物体的表面,将接触点的位置信息或电信号传递给检测设备,从而实现对物体表面形貌、尺寸或电性能等参数的测量。在这个过程中,探针的精度和稳定性对测量结果具有至关重要的影响。二、探针的操作要求在使用探针进行测量时,需要确保探针与被测物体表面的良好
    锦正茂科技 2025-04-02 10:41 56浏览
  • 文/Leon编辑/cc孙聪颖‍步入 2025 年,国家进一步加大促消费、扩内需的政策力度,家电国补政策将持续贯穿全年。这一利好举措,为行业发展注入强劲的增长动力。(详情见:2025:消费提振要靠国补还是“看不见的手”?)但与此同时,也对家电企业在战略规划、产品打造以及市场营销等多个维度,提出了更为严苛的要求。在刚刚落幕的中国家电及消费电子博览会(AWE)上,家电行业的竞争呈现出胶着的态势,各大品牌为在激烈的市场竞争中脱颖而出,纷纷加大产品研发投入,积极推出新产品,试图提升产品附加值与市场竞争力。
    华尔街科技眼 2025-04-01 19:49 195浏览
  • 退火炉,作为热处理设备的一种,广泛应用于各种金属材料的退火处理。那么,退火炉究竟是干嘛用的呢?一、退火炉的主要用途退火炉主要用于金属材料(如钢、铁、铜等)的热处理,通过退火工艺改善材料的机械性能,消除内应力和组织缺陷,提高材料的塑性和韧性。退火过程中,材料被加热到一定温度后保持一段时间,然后以适当的速度冷却,以达到改善材料性能的目的。二、退火炉的工作原理退火炉通过电热元件(如电阻丝、硅碳棒等)或燃气燃烧器加热炉膛,使炉内温度达到所需的退火温度。在退火过程中,炉内的温度、加热速度和冷却速度都可以根
    锦正茂科技 2025-04-02 10:13 50浏览
  • 职场之路并非一帆风顺,从初入职场的新人成长为团队中不可或缺的骨干,背后需要经历一系列内在的蜕变。许多人误以为只需努力工作便能顺利晋升,其实核心在于思维方式的更新。走出舒适区、打破旧有框架,正是让自己与众不同的重要法宝。在这条道路上,你不只需要扎实的技能,更需要敏锐的观察力、不断自省的精神和前瞻的格局。今天,就来聊聊那改变命运的三大思维转变,让你在职场上稳步前行。工作初期,总会遇到各式各样的难题。最初,我们习惯于围绕手头任务来制定计划,专注于眼前的目标。然而,职场的竞争从来不是单打独斗,而是团队协
    优思学院 2025-04-01 17:29 180浏览
  • 据先科电子官方信息,其产品包装标签将于2024年5月1日进行全面升级。作为电子元器件行业资讯平台,大鱼芯城为您梳理本次变更的核心内容及影响:一、标签变更核心要点标签整合与环保优化变更前:卷盘、内盒及外箱需分别粘贴2张标签(含独立环保标识)。变更后:环保标识(RoHS/HAF/PbF)整合至单张标签,减少重复贴标流程。标签尺寸调整卷盘/内盒标签:尺寸由5030mm升级至**8040mm**,信息展示更清晰。外箱标签:尺寸统一为8040mm(原7040mm),提升一致性。关键信息新增新增LOT批次编
    大鱼芯城 2025-04-01 15:02 186浏览
  • 提到“质量”这两个字,我们不会忘记那些奠定基础的大师们:休哈特、戴明、朱兰、克劳士比、费根堡姆、石川馨、田口玄一……正是他们的思想和实践,构筑了现代质量管理的核心体系,也深远影响了无数企业和管理者。今天,就让我们一同致敬这些质量管理的先驱!(最近流行『吉卜力风格』AI插图,我们也来玩玩用『吉卜力风格』重绘质量大师画象)1. 休哈特:统计质量控制的奠基者沃尔特·A·休哈特,美国工程师、统计学家,被誉为“统计质量控制之父”。1924年,他提出世界上第一张控制图,并于1931年出版《产品制造质量的经济
    优思学院 2025-04-01 14:02 141浏览
  • 在智能交互设备快速发展的今天,语音芯片作为人机交互的核心组件,其性能直接影响用户体验与产品竞争力。WT588F02B-8S语音芯片,凭借其静态功耗<5μA的卓越低功耗特性,成为物联网、智能家居、工业自动化等领域的理想选择,为设备赋予“听得懂、说得清”的智能化能力。一、核心优势:低功耗与高性能的完美结合超低待机功耗WT588F02B-8S在休眠模式下待机电流仅为5μA以下,显著延长了电池供电设备的续航能力。例如,在电子锁、气体检测仪等需长期待机的场景中,用户无需频繁更换电池,降低了维护成本。灵活的
    广州唯创电子 2025-04-02 08:34 136浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦