广告

详解ARM Neoverse V1和N2新平台技术细节,各有什么性能绝招

2021-04-28 22:42:49 阅读:
上个月底是Arm 10年来第一次更新设计架构-发布最新一代架构Armv9,本周公布了两个新平台,并发布了更多关于Neoverse N2和Neoverse V1的技术细节,以及Project Cassini 、Mesh互联技术Neoverse CMN-700。同时,Arm介绍了更多生态建设方面的进展,包括与腾讯、阿里云、甲骨文等公司合作的进展。
广告

上个月底是Arm 10年来第一次更新设计架构-发布最新一代架构Armv9,本周公布了两个新平台,并发布了更多关于Neoverse N2和Neoverse V1的技术细节,以及Project Cassini 、Mesh互联技术Neoverse CMN-700。同时,Arm介绍了更多生态建设方面的进展,包括与腾讯、阿里云、甲骨文等公司合作的进展。

Arm Neoverse V1全新计算平台发布

Arm今天还发布了全新的计算平台“Arm Neoverse V1”。

这是Arm设计的第一个支持SVE(可伸缩矢量扩展)的内核,可为高性能计算、机器学习带来大幅度的性能提升。

Arm N系列是注重平衡性、高能效的平台,Arm V系列则是追求极致性能,具备更大的缓冲、缓存、窗口、队列设计,拥有更大的带宽、面积、功耗。

基于性能至上的理念,V1平台创造了Arm迄今为止最宽的微架构,可容纳更多运行指令,支持高性能和百万兆级计算,再加上SVE功能,V1在单核性能上优势十分明显,全方位碾压N2平台。

而在强化单核性能的同时,V1平台也支持强大的多核心扩展,最多可以做到96核心96线程,工艺上可以使用7nm、5nm,还支持DDR5内存、PCIe 5.0总线、HBM2e高带宽内存、CCIX 1.1互连标准等。

Arm V1平台仍然基于Armv8.4-A CPU指令集,不过整体架构、模块组成和基于Armv9指令集的非常类似,有诸多相通之处,同时也有全方位的微架构改进,针对基准测试、服务器/高性能计算工作负载的全面增强,当然也不会不计代价地拉高功耗,同样在电源、功耗、发热管理方面做了强化。

相比于N1,作为Arm强调性能优先的新型计算系列的第一个平台,V1带来了50%的性能提升、1.8倍的矢量工作负载优化、4倍的机器学习工作负载优化,可以灵活地为高度依赖CPU性能、带宽的应用构建强大的计算能力,SoC设计也非常灵活。

生态方面,法国芯片公司SiPearl、韩国电子通信研究所(ETRI),都在打造基于V1平台的高性能SoC。

印度电子信息技术部(MeitY)夜间采纳V1平台,打造国家级百万兆级高性能计算项目。

另外,Arm今天同步发布了Arm Neoverse CMN-700,这是业界最先进的Mesh网格互连技术,能充分发挥V1、N2平台的性能、能效优势。

在上一代CMN-600的基础上,CMN-700在每个矢量上都进一步提升了性能,包括核心数量、缓存大小、附加内存及IO设备的数量和类型等等。

 

ARM Neoverse N2平台发布

今天,Arm又发布了第一个基于Armv9指令集架构的平台“Arm Neoverse N2”,在安全性、能耗、性能等方面都有全面的提升,可为新一代基础设施核心铺平道路。

Neoverse N系列平台最为注重性能的扩展性、平衡性,特别针对单位功耗、单位面积的性能,以及单位功耗、面积的核心数。

相比主要搭档7nm工艺的上代平台N1,新一代N2最佳搭档是5nm,两相对比在保持相同水平的功率、面积效率的基础上,N2的IPC同频性能(约等于单线程性能)可提升达40%,而频率也可以提高10%。

N2平台可以横跨从高吞吐量计算到功率与尺寸受限的边缘、5G应用场景,且性能提升明显,例如在云端上提升1.3倍的NGINX,在5G和边缘应用上提升1.2倍的DPDK数据包处理,以及提升1.4倍的SPECint2006。

N2平台内部集成了Armv9.0-A CPU核心、指令集单元、64KB一级指令缓存、64KB一级数据缓存、512KB/1MB ECC二级缓存、异步桥接(Async Bridges)、AMBA 5 CHI直接连接、CoreSight等模块,微架构全方位改进,重点增强基准测试、实际服务器工作负载。、

而在外部系统连接中,它可以支持DDR5内存、PCIe 5.0总线、HBM3高带宽内存,等等。

N2还是第一个具备SVE2功能的平台,可为云到边缘的性能效率带来巨大的提升,比如机器学习、数字信号处理、多媒体、5G等场景中,还具备编程简易性、可移植性等优势。

SMT同步多线程是如今处理器架构设计的一个核心要素,不过另一方面,在云端等共享环境中,专属内核可以提供更具可预测性、确定性的性能,而且更有利于抵御常见的侧信道攻击,这也是N2的理念。

同时,它维持了相同的功耗、面积效率,加入了性能定义功耗管理(PDP)。

N2平台起步就是32核心32线程,最多可以做到128核心128线程,对比N1平台翻了一番,同时比传统架构的64核心128线程更具竞争力。

生态方面,Marvell美满电子已经发布了基于Neoverse N2平台的OCTEON系列网络解决方案,预计2021年底前试产,相比上代性能提升高达3倍。

阿里云在即将上线的Arm架构ECS实例上已经完成测试,SPECjbb测试数据表现惊艳,而且基于Arm架构运行的DragonWell JDK性能提高了 50%。

腾讯也在硬件测试和软件支持方面持续投入,云应用上已经可以采用Arm Neoverse技术。

 

责编:editorAlice

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
  • OPPO一加9 Lemonade什么时候上市时间,价格定位旗舰令人期待 随着时间的推移,海外用户喜爱一加手机的程度也确实印证了当年一加的选择有多么的正确,不过这并不代表这这一手机品牌在国内用户的受欢迎程度低,我许多周围的朋友就在使用该品牌的手机,对这一品牌也抱有着非常高的期待。
  • Facebook明年发布首款智能眼镜,但消费类AR眼镜还要等5年以上 Facebook计划于明年发布首款智能眼镜,但要真正面向消费者销售增强现实(AR)眼镜,还需要5~10年的时间。
  • 印度临时变永久封禁59款中国APP(应用名单)意义何在,中印贸易会影响 今天印度政府出手很重,封禁了抖音、百度地图、微信、微博、QQ音乐等59个“Chinese Apps”以及游戏,音乐从所有印度手机中下架。理由是这些软件“威胁印度的主权、领土完整、国防、治安和社会秩序”。此前下架的59款中国应用已从此前的“临时下架”变为“永久下架”。
  • 华为Mate 40系列预告片出炉,高清渲染图遭曝光 华为Mate 40 系列何时发布呢?今天官方也是放出了新机的全新预告片。从华为手机今天放出的新预告来看,他们今天突出史上最强大Mate的一个主题“触动,无需触碰。”爆料人士Roland Quandt带来了华为Mate 40 Pro的高清渲染图。华为Mate 40 Pro采用6.76英寸OLED双曲面屏,屏幕形态为双挖孔。
  • 华为鸿蒙OS 2.0系统开源发布后,外国科技圈、媒体、网友热烈讨论和 华为已是世界无人不晓了,一直备受全球期待的华为鸿蒙OS 2.0,它将影响那些行业,那些领域、技术变化? 除了鸿蒙OS 2.0,华为还带来了EMUI 11和HMS生态的新进展,信息丰富。强链接能力、更快,、传输更安全,这是鸿蒙OS 2.0升级后最重要的变化。
  • 蚂蚁集团暂缓上市后首次发声回应,A+H股还会发布上市吗? 蚂蚁集团现在的资产规模,其本身早已是一家非常大的金融机构,而花呗、借呗的设计其内在逻辑是资产证券化。资产证券化其实并不是什么金融创新,无非是旧药换新瓶。蚂蚁集团是今年话题最多的企业之一,上市造富话题还没退热,蚂蚁又被暂停上市。
  • 最新数据分析 :2021年上半年十大SUV、轿车品牌车型销量排名 单纯看外观,SUV、轿车品牌你会选哪个, 销量比较好的新车型都有着强大的市场影响力和优良的口碑,我们一起来看看中国汽车工业协会这份最新数据分析
  • 小米MIX Fold折叠屏手机回归:67.1W快充、骁龙888处理器、WIFI6 小米新品发布会还将迎来小米MIX闪亮重返舞台上和米粉们见面。小米MIX系列可折叠屏新机采用了时下主流顶级的设计和硬件,内折叠方案+最好的三星柔性屏幕,以及旗舰级硬件配置,如果最终起步价在万元以内的话,无疑会销量卖爆,也进一步推动可折叠屏智能手机走进普通人手中。
  • 微软更新内核补丁,Linux Hyper-V 代码的基础变更 微软所使用的 Cloud-Hypervisor,其实是由英特尔帮忙开发的。而该虚拟化管理程序,又是用 Rust 语言编写的。
  • 基于类别深度典型相关分析的多模态数据下的细粒度场发现 通过研究照片和场所在多模式内容上的富文本描述之间的跨模式相关性,研究了细粒度的场所发现。与以往的研究不同,这项工作共同优化了成对相关性和基于类别的相关性,同时实现了精确的场所搜索和团体场所搜索。大量实验证实:第一,与最新方法相比,提出的 C-DCCA 方法大大提高了分组场所发现的性能。第二,使用粗略的位置信息有助于缩小 C-DCCA 和 DCCA 在精确场地搜索中的差距。第三,使用额外的图像资源来表示场地的视觉效果有助于进一步提高细粒度场地发现的性能。
  • Omdia :2024年生成式AI软件市场将增长124% 许多拥有大型语言模型(LLM)的供应商的收入运行率表明,2024 年的收入增长将达到三位数……
  • IDC首测8款最热门移动端大模型,3款获好评 本次报告的测评涵盖了市面上最热门的八个Chatbot App:kimi智能助手、豆包、海螺AI、天工、通义、文心一言、讯飞星火以及智谱清言(按照公司拼音首字母顺序排列)。
  • Imagination GPU为边缘智能提供高效率的加速 在“2024奕斯伟计算开发者伙伴大会”上,来自Imagination英国总部的专家发表了主题为《用RISC-V CPU + PowerVR GPU迎接边缘生成式AI的到来》的演讲。
  • 面向AI的下一代以太网技术 随着AI应用的广泛普及和数据流量的迅猛增长,传统以太网技术在延迟、带宽、拥塞控制和高性能可扩展方面天然局限,导致其难以应对AI网络的复杂需求。
  • 智能手机疲软,但超薄柔性玻璃出货量势头正猛 可折叠盖板玻璃必须符合以下所有标准:透明、可折叠、坚固、平整和轻薄,这些基本要素缺一不可。
  • 全球折叠屏手机快速增长,中国品牌压制三星 • 得益于西欧、关键亚洲市场和拉丁美洲市场的增长,以及中国品牌的持续领先,全球折叠屏手机出货量在2024年第二季度同比增长了48%。 • 荣耀凭借其在西欧特别强劲的表现,成为最大的贡献者,成为该地区排名第一的品牌。 • 摩托罗拉的Razr 40系列在北美和拉丁美洲表现良好,为其手机厂商的出货量贡献了三位数的同比增长。 • 我们预计,头部中国手机品牌厂商的不断增加将至少在短期内抑制三星Z6系列在第三季度的发布。
  • AI网络物理层底座: 大算力芯片先进封装技术 AI技术的发展极大地推动了对先进封装技术的需求,在高密度,高速度,高带宽这“三高”方面提出了严苛的要求。
  • 智能手表OLED面板超 60%中国制造 智能手表在新冠肺炎疫情后获得了越发广泛的关注,其功能包括语音、健康检查、运动和活动追踪、GPS、通信和个人数据监控。全球智能手表显示面板的出货量已从2022年的2.59亿片增长到2023年的3.51亿片。到 2024年,Omdia预测智能手表显示面板的出货量将达到3.59亿片,其中TFT LCD占63%,OLED占37%。
  • 无处不在的Arm软硬件生态赋能开发者AI创新 随着计算变得愈发复杂,计算效率的重要性更胜以往。
  • 荣耀拿下欧洲横折手机榜第一 既然可以保留几乎相同的旧款手机,或者以更低的价格购买旧款手机,为什么要购买最新款的智能手机呢?但变化已经到来,智能手机品牌厂商正带着其最前沿的创新技术重返欧洲市场……
广告
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了