广告

什么给了ARM自信,去挑战Intel称霸的超级计算机领域?

时间:2016-08-24 18:30:00 作者:Rick Merritt 阅读:
ARM的强项在于其相较于x86架构更具省电效益的潜力,此特性对于实际上不太容易为想要打造的超大规模系统提供大量电力的超级计算机设计工程师来说颇具帮助。
广告

ARM 开发了一种向量指令集(vector instruction),旨在将64位的V8架构推进高性能运算应用领域;而日本业者富士通(Fujitsu)采用ARM架构所开发、设置于日本理研研究所(Riken Institute)的K Computer (原本采用Sparc架构)后续版本(Post-K),达到了8 petaflops的运算性能,成为2011年时全球最强的超级计算机系统。

K Computer让ARM处理器首次进军超级计算机领域,一个由Intel x86架构称霸的稀有市场;而ARM期望能进一步扩展在这个市场的版图,慢慢取代如IBM或Cray等由超级计算机厂商自主开发的处理器。ARM的强项在于 其相较于x86架构更具省电效益的潜力,此特性对于实际上不太容易为想要打造的超大规模系统提供大量电力的超级计算机设计工程师来说颇具帮助。

目前ARM支持的Neon SIMD指令集仅限于128位,锁定客户端系统的成像与视频应用;而其可伸缩向量扩充指令集(scalable vector extensions,SVE),支持在128位上128~2,048位长度的增量(increment),使用者能写入一次向量程序代码,并能无须重新编译、在任何尺寸的向量设计上执行该程序代码,而此功能号称是其他架构无法支持的。

SVE是一组新的指令集,锁定科学研究任务而非以数字信号处理器(DSP)为基础的多媒体加速应用;富士通表示,该公司打算在2020年推出的K Computer后续版本采用SVE,让系统性能比前一代提升五十倍、省电效益提升十五倍。

据 了解,SVE是一种负载/储存(load/store)架构,采用最多32个向量缓存器(register)以及16个述词(predicate)暂存器,加上控制缓存器以及一个first-fault缓存器;所谓的述词缓存器是用来管理关于控制回路的不同决策,ARM为其未来对SVE的扩展预留了编程空间。

SVE规格是由数个合作伙伴共同开发,预定明年初公布,ARM才该开始研究将如何为该扩充指令集制作开放源码Linux修补程序。
20160823 ARM NT03P1
*ARM展现了SVE上不同向量长度的可伸缩特性,图中的结果是根据以不同向量长度编译的程序代码之模拟
(来源:ARM)*

所有的ARM 64位核心授权厂商都能取得SVE技术;ARM院士暨主架构师Nigel Stephens在近日于美国硅谷举行的Hot Chips大会上表示,该公司已经有多个合作伙伴正在进行开发,但目前不能透露任何公司名称。

而对富士通来说,K Computer的合作案,提供与开始进军高性能运算领域的ARM建立更进一步伙伴关系的机会;负责开发K Computer后续版本处理器、目标是让该系统在2020年达到exaflop性能等级的富士通主架构师Toshio Yoshida 表示,Sparc目前仍是该公司商业用服务器偏好的架构,不过他们也看到一系列采用ARM芯片之技术与科学用新系统的商机。

Yoshida 透露,富士通的K Computer后续版本将采用512位SIMD向量单元,在I/O部分将采用该公司的某个版本Tofu互连以及其他加速器核心;不过他对于该处理器晶 片目前锁定采用哪种“先进”工艺节点三缄其口。他表示,富士通选择512位向量长度,是因为那正好是其前一代Sparc架构系统256位SIMD的一倍:“我们想在这个领域把步伐放慢一点。”
20160823 ARM NT03P2
*SVE占据28位的编码区域,而且只有ARM的64位核心能支持
(来源:ARM)*

编译:Judith Cheng

本文授权编译自EE Times,版权所有,谢绝转载

EETC wechat barcode


关注最前沿的电子设计资讯,请关注“电子工程专辑微信公众号”。

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
Rick Merritt
EE Times硅谷采访中心主任。Rick的工作地点位于圣何塞,他为EE Times撰写有关电子行业和工程专业的新闻和分析。 他关注Android,物联网,无线/网络和医疗设计行业。 他于1992年加入EE Times,担任香港记者,并担任EE Times和OEM Magazine的主编。
  • 全球裁员、订单转包,英特尔陷入“芯片代工困境” 不管怎么样,英特尔仍在努力推进18A芯片工艺,以期未来在最先进的芯片工艺上能与台积电、三星有一定的领先优势,毕竟其已经率先拿到ASML两台最先进的High NA(高数值孔径)EUV光刻机。未来,英特尔没有选择,只有抓住任何的可能性,硬着头皮上。
  • 谈谈Lunar Lake的低功耗设计:听说x86做不了低功耗? 一直听说x86指令集天生做不了低功耗,真的是这样吗?这篇文章着重谈谈酷睿Ultra二代是怎么考量低功耗的,有没有可能做到低功耗...
  • 传英特尔考虑出售Mobileye部分股权,以更好地聚焦核心业务 经营业绩下滑,以及在代工业务上的巨额亏损以及市场需求疲软,也或是英特尔出售Mobileye股份的重要原因之一。
  • 现在的工作站电脑变成什么样了?60核至强W处理器发布 Intel刚刚发布了至强W-2500与W-3500系列处理器,最高60个核心,面向工作站设备。现在的工作站,相比从前似乎已经大不一样了...
  • 英特尔披露Granite Rapids-D至强6 SoC细节,将在2025年上半年推出 在性能方面,Granite Rapids-D至强6 SoC采用了英特尔最新的Intel 3工艺计算小芯片与基于Intel 4的边缘优化I/O小芯片相结合的创新设计,提供了显著的性能、能效和晶体管密度提升。
  • Rapidus需要多少资金,才能支撑起2nm生产计划? 即使Rapidus已经获得9200亿日元的政府援助,但仍有大量资金需要从私营部门筹集。为了弥补这一资金缺口,Rapidus不得不寻求银行贷款和其他私人融资渠道。Atsuyoshi Koike也坦言,由于Rapidus的业务尚处于起步阶段,因此很难获得私人实体的支持。
  • 全球折叠屏手机快速增长,中国品牌压 • 得益于西欧、关键亚洲市场和拉丁美洲市场的增长,以及中国品牌的持续领先,全球折叠屏手机出货量在2024年第二季度同比增长了48%。 • 荣耀凭借其在西欧特别强劲的表现,成为最大的贡献者,成为该地区排名第一的品牌。 • 摩托罗拉的Razr 40系列在北美和拉丁美洲表现良好,为其手机厂商的出货量贡献了三位数的同比增长。 • 我们预计,头部中国手机品牌厂商的不断增加将至少在短期内抑制三星Z6系列在第三季度的发布。
  • AI网络物理层底座: 大算力芯片先进 AI技术的发展极大地推动了对先进封装技术的需求,在高密度,高速度,高带宽这“三高”方面提出了严苛的要求。
  • 奕斯伟计算DPC 2024:发布RISAA(瑞 奕斯伟计算2024首届开发者伙伴大会以“绿色、开放、融合”为主题,从技术创新、产品应用、生态建设等方面,向开发者、行业伙伴等相关方发出开放合作倡议,加速RISC-V在各行各业的深度融合和应用落地,共同推动RISC-V新一代数字基础设施生态创新和产业发展。
  • 重磅发布:Canalys 2024年中国云渠道 2024年 Canalys 中国云计算渠道领导力矩阵冠军厂商分别是:阿里云、华为云和亚马逊云科技(AWS)
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了