媒体观点|英特尔在异构计算前加了一个“超”字,凭什么?

知IN 2021-07-15 18:00

本文作者:付斌

本文转载自21ic电子网


数据的量变和质变之下,人工智能正以25%的复合年增长率“疯狂生长”。从量上来讲,大量的数据由人变为终端设备自主生产;从质上来讲,数据不再是结构化数据,更多偏向利用编程处理。


“目前AI模型训练模式的能源是不可持续的,释放人工智能的超级力量的必由之路是超异构计算”,英特尔研究院副总裁、英特尔中国研究院院长宋继强在2021年的WAIC上如是说。


打好异构计算的地基


要了解超异构计算,就先要明白什么是异构计算。根据宋继强的介绍,异构计算就是将不同架构处理芯片整合到一个系统内工作。具体实施上来讲包括两种,其一为芯片级集成方式,即将CPU IP、GPU IP、DSP IP等集成到单一SoC内;另一种则为板级集成方式,将CPU、GPU、FPGA等放在一个板上组合。


对应在英特尔上便是一直强调的XPU战略,用不同架构去处理不同类型数据,根据处理速度或带宽要求进行优化。


宋继强表示,CPU适宜处理标量运算,一个一个算,比如控制流,非常容易处理,可以并发;GPU适宜处理矢量运算,很多数据一起算;AI更多是块状运算,需要专门做矩阵加速,数据存取也需要优化;FPGA特别适合稀疏运算,可以大幅度降低I/O及计算消耗。将这些整合起来就能各取所需,打好组合拳



宋继强以英特尔的“看家本领”CPU举例,实际上至强处理器作为标准的标量运算处理器内部也加入了异构计算。英特尔不仅加入了专门的深度学习加速器件,同时拥有可扩展的一些配置,另外AVX-512专门针对矢量运算进行加速,可以针对深度学习用的不同架构。


通过以上各种特性,通用服务器性能已经提升了46%,而专门针对AI训练和加速,已经提升了74%,这比市面上其他厂商的CPU或者是GPU相对应的能力提升强劲。


这仅仅是CPU层面的异构计算,除此之外,GPU层面英特尔也有Xe架构的独立GPU, ASIC层面上拥有Habana、Movidius等,还有强大的FPGA、eAISC产品线等



除了传统的加速器,英特尔还研究了远远领先现如今架构的计算形式。英特尔神经拟态计算Loihi芯片是一个存算一体的架构,并且非常容易扩展。Loihi芯片Die内包含128个小核,每个核里面模拟1024个神经元的计算结构,可以模仿13万个神经元,每个神经元又有1000个突触连接。不止如此,这样的芯片还可以继续连接起来,做到768个芯片连接起来,做到接近1亿神经元的系统。


与传统深度学习加速器相比,Loihi没有任何的浮点运算,这是因为人脑中也是没有乘加器的,所以其学习和训练方法走的是另一种方法。Loihi基于SNN,拥有极低的功耗,同时设计之初就是异步设计,只有工作部分是耗电的,不工作的区域是休息的,得益于此在电效率上是现在的深度学习加速芯片的1000倍。值得一提的是,这种架构模式的加速器也是可以用在异构计算之中的。



从异构计算到超异构计算


那么,英特尔这几年开始一直谈及的“超异构计算究竟是什么”,凭什么英特尔多加一个“超”字?根据宋继强的解释,顾名思义超异构计算是“下一个等级”的异构计算,相比传统的异构计算还要再加上更强大的封装互连能力和软件能力。


1、超异构计算的封装互连能力


宋继强为记者表示,实际上异构封装是一个更小型的系统,将不同的计算能力整合在一起。由不同的Die整合起来的,所以能够利用不同架构芯片,在处理不同的数据、不同的任务的时候有独特的性能和功耗优势。


谈及英特尔的封装技术,宋继强表示,英特尔在2.5D上拥有EMIB封装技术,该技术已有诸如AIB的产业标准推出。EMIB可以形象地比喻成,在一个平面上,将两个平房间的下水通连通起来。在3D上拥有Foveros封装技术,该技术可以在计算Die和计算Die间建立互连,而不只是传统的计算Die和Memory Die间互连。Foveros可以形象地比喻成,在三维空间上盖高楼。与此同时,两项技术还可以相结合为Co-EMIB技术。


另外,2020年8月英特尔还宣布了Hybrid Bonding技术,能够进一步缩小封装时裸片之间的凸点间距和功耗,这些技术英特尔已经在一些产品上使用了。这样的封装技术可以让很多新的芯片很好地进行互连,而且英特尔最新架构的类脑芯片也可以和传统的CPU、GPU互相组合。



除了已经在用的封装技术,英特尔在持续研究变革未来的创新集成光电技术,持续光互连的变革性能力。

宋继强表示,计算能力提升后,不同处理器的计算能力随之提升,这就需要更多的数据交互,跨处理器之间,甚至是跨服务器节点间的数据交互。当数据交互继续增加时,I/O将会成为瓶颈,这个瓶颈将体现在尺寸和功耗上,更多的电给了I/O,而计算能力会越来越少。

他表示,英特尔认为光是替代铜的非常好的互连的介质,但是光本身拥有器件较大、光电间转换困难、转换效率不高的问题。因此英特尔为了解决这种问题会将光器件与电器件紧密封装在一起,让二者靠近,减少两端转换损耗;其次制作出收发器,以更小的模式放到服务器内。

英特尔研究院将很多光处理过程的几个模块做成非常小的模块,可以将光产生、光放大、光检测、光调制和CMOS光处理器件整合到一个芯片中,也就是说集成的光电可以大幅度缩小整个系统的尺寸和功耗。

英特尔在硅光子上深耕多年,不仅为客户提供超过400万个100G的硅光子产品,还研究出业界首个封装光学以太交换机。



2、超异构计算的软件能力

异构计算还要构建软件能力,之前行业普遍忽略了软件层的重要性。软件方面上进一步支持AI也是一个很大的课题,软件优化与否在同一个硬件上可以达到百倍的性能差异。尤其是在跨不同单元间同步的问题上,软件优化能够大幅度提升性能。

实际上,反映在编程人员上的问题便是,CPU、GPU、FPGA等不同芯片的开发模式和语言均不同,这种情况下同时发挥多种XPU的性能上就成了一个难题。

英特尔的一体化平台oneAPI就是要创造让编程人员很轻松的,以一套API去使用未来想要的功能性的目标。对软件开发者来说,可以只学Python或是C++,最终程序都可以享受到异构集成的各种优势,并且如果未来硬件升级替代,软件不需要非常多的改动。

宋继强强调,英特尔在oneAPI中投入很大,自从去年推出了Gold版本后,得到非常好的市场反响。另外,现在oneAPI整个社区硬件支持当中,早已不只是英特尔的硬件,友商的CPU、GPU、ASIC都是可用的,这是对整个社区的贡献



关于AI不得不谈及的问题


对于推动AI创新上,宋继强认为垂直整合是驱动未来产业规模化扩展的重要发力点。他对记者解答,垂直整合是真正可以让AI将算法创新、硬件落实到实处,形成迭代滚动放大效应的必经之路。


垂直整合瞄准一些可以规模化,软硬件结合可以创造更大价值的领域,用应用去拉动多种AI技术的垂直整合。


垂直整合向来比单独一个技术创新难得多,首先要能够接触到这么多种资源、数据和实际应用场景,其次也要有跨层的专家参与在其中。但无论多么困难,AI创新要真正规模化发展一定要严肃认真地进行垂直整合。


在此方面,Mobileye作为英特尔收购的一个子公司,就把AI能力,通过软件、硬件、传感器整合起来形成很好的方案,开创非常独特的出行即服务的体系。


对于AI的落地问题上,宋继强认为,英特尔有一些机制可以去帮助企业更好的落地。“比如说“AI百佳创业激励计划”,我们的生态发展部门就创建了这样一个平台,可以帮助他们加速,在中间把他们连接起来,在市场层面进行推动。所以AI落地是一个大问题。”


AI的可信和安全逐渐大面积讨论下,AI治理也成为了热点话题。宋继强认为,对英特尔而言,作为通用技术方案提供商,SGX、同态加密、联邦学习硬件加速这种技术就可以帮助一些客户。


全栈实力推动AI发展


总结来说,英特尔释放AI潜力是通过自身全栈实力推进的,包括硬件层面、前沿计算层面、软件层面和生态构建层面四个方面的。


在硬件层面,英特尔以内置AI加速的至强可扩展处理器为基础,提供全面的XPU芯片平台。


在前沿计算层面,英特尔持续投资和发展量子计算、神经拟态计算等面向未来的计算创新,探索驱动AI持续发展的新架构。


在软件层面,英特尔提供经过全面优化的软件,包括OpenVINO、oneAPI、Analytics Zoo、Tensor Flow、BigDL等,涵盖库、框架以及工具与解决方案等多个层面,用以加速并简化从云到端的范围内人工智能技术的开发与部署。


在生态构建层面,英特尔与中国产、学、研广泛合作,协同开展前沿研究、联手促进人才培养、共同打造开放生态。



本文仅代表媒体观点

文中图片等素材的版权归其所有者拥有



相关资讯



点赞还是在看?

知IN 一手、专业、有料! 知IN,英特尔中国自媒体,传递最新鲜的英特尔资讯,呈现最清晰的英特尔战略及业务进展,提供最前沿的洞察与趋势解读。
评论
  •  万万没想到!科幻电影中的人形机器人,正在一步步走进我们人类的日常生活中来了。1月17日,乐聚将第100台全尺寸人形机器人交付北汽越野车,再次吹响了人形机器人疯狂进厂打工的号角。无独有尔,银河通用机器人作为一家成立不到两年时间的创业公司,在短短一年多时间内推出革命性的第一代产品Galbot G1,这是一款轮式、双臂、身体可折叠的人形机器人,得到了美团战投、经纬创投、IDG资本等众多投资方的认可。作为一家成立仅仅只有两年多时间的企业,智元机器人也把机器人从梦想带进了现实。2024年8月1
    刘旷 2025-01-21 11:15 630浏览
  • 故障现象 一辆2007款日产天籁车,搭载VQ23发动机(气缸编号如图1所示,点火顺序为1-2-3-4-5-6),累计行驶里程约为21万km。车主反映,该车起步加速时偶尔抖动,且行驶中加速无力。 图1 VQ23发动机的气缸编号 故障诊断接车后试车,发动机怠速运转平稳,但只要换挡起步,稍微踩下一点加速踏板,就能感觉到车身明显抖动。用故障检测仪检测,发动机控制模块(ECM)无故障代码存储,且无失火数据流。用虹科Pico汽车示波器测量气缸1点火信号(COP点火信号)和曲轴位置传感器信
    虹科Pico汽车示波器 2025-01-23 10:46 60浏览
  • 本文介绍瑞芯微开发板/主板Android配置APK默认开启性能模式方法,开启性能模式后,APK的CPU使用优先级会有所提高。触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。源码修改修改源码根目录下文件device/rockchip/rk3562/package_performance.xml并添加以下内容,注意"+"号为添加内容,"com.tencent.mm"为AP
    Industio_触觉智能 2025-01-17 14:09 190浏览
  • 数字隔离芯片是一种实现电气隔离功能的集成电路,在工业自动化、汽车电子、光伏储能与电力通信等领域的电气系统中发挥着至关重要的作用。其不仅可令高、低压系统之间相互独立,提高低压系统的抗干扰能力,同时还可确保高、低压系统之间的安全交互,使系统稳定工作,并避免操作者遭受来自高压系统的电击伤害。典型数字隔离芯片的简化原理图值得一提的是,数字隔离芯片历经多年发展,其应用范围已十分广泛,凡涉及到在高、低压系统之间进行信号传输的场景中基本都需要应用到此种芯片。那么,电气工程师在进行电路设计时到底该如何评估选择一
    华普微HOPERF 2025-01-20 16:50 119浏览
  • Ubuntu20.04默认情况下为root账号自动登录,本文介绍如何取消root账号自动登录,改为通过输入账号密码登录,使用触觉智能EVB3568鸿蒙开发板演示,搭载瑞芯微RK3568,四核A55处理器,主频2.0Ghz,1T算力NPU;支持OpenHarmony5.0及Linux、Android等操作系统,接口丰富,开发评估快人一步!添加新账号1、使用adduser命令来添加新用户,用户名以industio为例,系统会提示设置密码以及其他信息,您可以根据需要填写或跳过,命令如下:root@id
    Industio_触觉智能 2025-01-17 14:14 140浏览
  • 随着消费者对汽车驾乘体验的要求不断攀升,汽车照明系统作为确保道路安全、提升驾驶体验以及实现车辆与环境交互的重要组成,日益受到业界的高度重视。近日,2024 DVN(上海)国际汽车照明研讨会圆满落幕。作为照明与传感创新的全球领导者,艾迈斯欧司朗受邀参与主题演讲,并现场展示了其多项前沿技术。本届研讨会汇聚来自全球各地400余名汽车、照明、光源及Tier 2供应商的专业人士及专家共聚一堂。在研讨会第一环节中,艾迈斯欧司朗系统解决方案工程副总裁 Joachim Reill以深厚的专业素养,主持该环节多位
    艾迈斯欧司朗 2025-01-16 20:51 308浏览
  • 临近春节,各方社交及应酬也变得多起来了,甚至一月份就排满了各式约见。有的是关系好的专业朋友的周末“恳谈会”,基本是关于2025年经济预判的话题,以及如何稳定工作等话题;但更多的预约是来自几个客户老板及副总裁们的见面,他们为今年的经济预判与企业发展焦虑而来。在聊天过程中,我发现今年的聊天有个很有意思的“点”,挺多人尤其关心我到底是怎么成长成现在的多领域风格的,还能掌握一些经济趋势的分析能力,到底学过哪些专业、在企业管过哪些具体事情?单单就这个一个月内,我就重复了数次“为什么”,再辅以我上次写的:《
    牛言喵语 2025-01-22 17:10 162浏览
  • 高速先生成员--黄刚这不马上就要过年了嘛,高速先生就不打算给大家上难度了,整一篇简单但很实用的文章给大伙瞧瞧好了。相信这个标题一出来,尤其对于PCB设计工程师来说,心就立马凉了半截。他们辛辛苦苦进行PCB的过孔设计,高速先生居然说设计多大的过孔他们不关心!另外估计这时候就跳出很多“挑刺”的粉丝了哈,因为翻看很多以往的文章,高速先生都表达了过孔孔径对高速性能的影响是很大的哦!咋滴,今天居然说孔径不关心了?别,别急哈,听高速先生在这篇文章中娓娓道来。首先还是要对各位设计工程师的设计表示肯定,毕竟像我
    一博科技 2025-01-21 16:17 151浏览
  • 嘿,咱来聊聊RISC-V MCU技术哈。 这RISC-V MCU技术呢,简单来说就是基于一个叫RISC-V的指令集架构做出的微控制器技术。RISC-V这个啊,2010年的时候,是加州大学伯克利分校的研究团队弄出来的,目的就是想搞个新的、开放的指令集架构,能跟上现代计算的需要。到了2015年,专门成立了个RISC-V基金会,让这个架构更标准,也更好地推广开了。这几年啊,这个RISC-V的生态系统发展得可快了,好多公司和机构都加入了RISC-V International,还推出了不少RISC-V
    丙丁先生 2025-01-21 12:10 477浏览
  • 现在为止,我们已经完成了Purple Pi OH主板的串口调试和部分配件的连接,接下来,让我们趁热打铁,完成剩余配件的连接!注:配件连接前请断开主板所有供电,避免敏感电路损坏!1.1 耳机接口主板有一路OTMP 标准四节耳机座J6,具备进行音频输出及录音功能,接入耳机后声音将优先从耳机输出,如下图所示:1.21.2 相机接口MIPI CSI 接口如上图所示,支持OV5648 和OV8858 摄像头模组。接入摄像头模组后,使用系统相机软件打开相机拍照和录像,如下图所示:1.3 以太网接口主板有一路
    Industio_触觉智能 2025-01-20 11:04 189浏览
  • 日前,商务部等部门办公厅印发《手机、平板、智能手表(手环)购新补贴实施方案》明确,个人消费者购买手机、平板、智能手表(手环)3类数码产品(单件销售价格不超过6000元),可享受购新补贴。每人每类可补贴1件,每件补贴比例为减去生产、流通环节及移动运营商所有优惠后最终销售价格的15%,每件最高不超过500元。目前,京东已经做好了承接手机、平板等数码产品国补优惠的落地准备工作,未来随着各省市关于手机、平板等品类的国补开启,京东将第一时间率先上线,满足消费者的换新升级需求。为保障国补的真实有效发放,基于
    华尔街科技眼 2025-01-17 10:44 236浏览
  •  光伏及击穿,都可视之为 复合的逆过程,但是,复合、光伏与击穿,不单是进程的方向相反,偏置状态也不一样,复合的工况,是正偏,光伏是零偏,击穿与漂移则是反偏,光伏的能源是外来的,而击穿消耗的是结区自身和电源的能量,漂移的载流子是 客席载流子,须借外延层才能引入,客席载流子 不受反偏PN结的空乏区阻碍,能漂不能漂,只取决于反偏PN结是否处于外延层的「射程」范围,而穿通的成因,则是因耗尽层的过度扩张,致使跟 端子、外延层或其他空乏区 碰触,当耗尽层融通,耐压 (反向阻断能力) 即告彻底丧失,
    MrCU204 2025-01-17 11:30 209浏览
  •     IPC-2581是基于ODB++标准、结合PCB行业特点而指定的PCB加工文件规范。    IPC-2581旨在替代CAM350格式,成为PCB加工行业的新的工业规范。    有一些免费软件,可以查看(不可修改)IPC-2581数据文件。这些软件典型用途是工艺校核。    1. Vu2581        出品:Downstream     
    电子知识打边炉 2025-01-22 11:12 117浏览
  • 2024年是很平淡的一年,能保住饭碗就是万幸了,公司业绩不好,跳槽又不敢跳,还有一个原因就是老板对我们这些员工还是很好的,碍于人情也不能在公司困难时去雪上加霜。在工作其间遇到的大问题没有,小问题还是有不少,这里就举一两个来说一下。第一个就是,先看下下面的这个封装,你能猜出它的引脚间距是多少吗?这种排线座比较常规的是0.6mm间距(即排线是0.3mm间距)的,而这个规格也是我们用得最多的,所以我们按惯性思维来看的话,就会认为这个座子就是0.6mm间距的,这样往往就不会去细看规格书了,所以这次的运气
    wuliangu 2025-01-21 00:15 299浏览
  • 80,000人到访的国际大展上,艾迈斯欧司朗有哪些亮点?感未来,光无限。近日,在慕尼黑electronica 2024现场,ams OSRAM通过多款创新DEMO展示,以及数场前瞻洞察分享,全面展示自身融合传感器、发射器及集成电路技术,精准捕捉并呈现环境信息的卓越能力。同时,ams OSRAM通过展会期间与客户、用户等行业人士,以及媒体朋友的深度交流,向业界传达其以光电技术为笔、以创新为墨,书写智能未来的深度思考。electronica 2024electronica 2024构建了一个高度国际
    艾迈斯欧司朗 2025-01-16 20:45 862浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦