40核心25倍性能碾压64核心!Intel 10nm至强隆重登场

硬件世界 2021-04-08 00:00

说到处理器,对于大众用户而言,关注最多的自然是距离最近的桌面、笔记本消费级产品,而作为厂商最新技术的最强代表,服务器、数据中心才是真正的杀场。


3月16日,AMD发布了第三代霄龙7003系列(代号Milan),拥有7nm工艺、Zen3架构、64核心128线程等傲人规格。近几年,AMD在数据中心领域也是不断取得突破,市场份额已经从当初的0.7%,来到了7%之上。


但在这个庞大的市场上,Intel依然是王者一般的存在。虽然单看产品性能参数可能有些不敌,但无论是多达13倍的市场份额领先,还是全面丰富的技术特性,抑或更广阔的生态应用系统,都不是一个数量级。


事实上,这么多年来,Intel至强几乎已经等于服务器、数据中心的代名词,2013年至今累计云端部署超过10亿个核心,云服务商超过800家,发展了三代的可扩展至强累计出货也已超过5000万颗。



现在,Intel终于带来了第三代至强可扩展平台Ice Lake-SP,再次将自己的优势展现得淋漓尽致,尤其是丰富的产品矩阵。



本次中国区发布会选在了首钢园三高炉,颇有赛博朋克气息,也是冬奥会场地,往昔与未来在这里交织



Intel副总裁兼中国区总经理王锐发表主题演讲



新至强拥有全新的10nm制造工艺、最多40核心80线程、全新Sunny Cove CPU架构、20% IPC性能提升、46%平均性能提升、74% AI推理性能提升,堪称Intel至强近年来最大的一次飞跃。




但是,新至强不是单打独斗,周边围绕着Intel GPU、XPU、FPGA、内存、存储、连接、安全等等各条产品线和技术,从而构成一个软硬结合的完整解决方案。


此前已经陆续发布的傲腾持久内存Pm200系列、傲腾SSD P5800X、闪存SSD D5-P5316/D7-P5510、20万兆以太网卡E810、Agilex FPGA等等,这些都是新至强的得力助手,互相结合大大拓展了整体平台的实力。


按照Intel的说法:“我们没有把至强称作一个服务器产品,它是一个数据中心产品。”



需要指出的是,去年6月19日发布的Cooper Lake,也是属于第三代至强可扩展家族,区别在于Cooper Lake只用于四路、八路市场,而新的Ice Lake-SP则是针对单路、双路市场。


说起来,Ice Lake-SP可谓命运多舛,发布时间一再延迟,主要是和新上的10nm工艺有关,而且引入了全新架构(Cooper Lake还是14nm和老架构),导致同一家族的两个系列产品间隔了将近10个月。



当然了,对于数据中心平台而言,正式发布并不是开始,事实上在发布之前,Ice Lake-SP已经出货了20多万颗,拥有了极为丰盛的产品、方案。


王锐也表示:“至强处理器的出货有保证,特别是数据中心。我们在全力提升产能,实际的提升比计划更高。”


另外在新的CEO帕特·基因格上任后,Intel已经在大刀阔斧地变革自己,包括加速推进新架构新工艺新产品,强化制造和产能,开放代工和外包。


接下来,我们就从架构技术、性能、生态三个方面,深入了解一下Ice Lake-SP。



Intel市场营销集团副总裁兼中国区数据中心销售总经理陈葆立展示Ice Lake-SP


一、架构技术:全面翻新、延迟优秀



Intel提出,新至强最值得关注的变化,主要有三个方面,一是目前唯一內建AI加速的x86数据中心处理器,二是高级先进的安全解决方案,三是可扩展性、灵活性、可定制性。


接下来的解读中,我们也会逐一涉及这三个方面。



架构方面,新至强引入了Sunny Cove,也就是轻薄笔记本上Ice Lake-U 10代低功耗酷睿平台的同款(事实上二者处理器代号都是相通的),都是首次结缘10nm,当然这次针对数据中心应用做了调整优化。


至于为何二者发时间错开了一年半,笔记本端去年都已经进化到第二代10nm Tiger Lake,架构也已升级为Willow Cove,你应该懂的。




简单来说,Sunny Cove架构改进了前端部分,容量更大,分支预测更精准,加宽加深了流水线,结构和执行资源上规模更大,同时增强了TLB、单线程执行、预取等环节,还针对数据中心重点优化了缓存、矢量吞吐等部分。


对比二代可扩展至强Cascade Lake,新至强的最大核心数从28个增加到40个。


对于为何选择40核心这个节点,陈葆立表示,这是根据整个产品迭代所做的一个比较好的平衡,无论是核心数,还是不同工作负载的加速指令、配套的产品,设计芯片需要做很多事情,尤其是把功能做好是最优先的,能够更好地满足客户需要,而不是纯粹选一个核心数。


当然,不同的设计策略也决定了核心数量。AMD霄龙是多个小芯片组成,虽然每个小芯片最多也才8个核心,但可以通过“并联”轻松堆砌更多核心。


Intel则依然坚持单芯片设计,再加上制造工艺、内部架构,天然决定了不容易扩展太多核心,不过Intel也在不断推进各种先进封装技术,未来的芯片规模有望实现突飞猛进。




每核心缓存一级从32KB增大一半来到48KB,二级从1MB增大四分之一来到1.25MB,三级而从1.375MB小幅增大1.5MB,并支持Hemisphere高性能交错模式。


内存支持从六通道DDR4-2933扩展到了八通道DDR4-3200,并改进内存调度器实现更低的延迟、更高的带宽,而且还有傲腾持久内存200系列这个杀手锏。


处理器间互连通道还是两条或三条UPI总线,但是带宽从10.4GT/s扩大到11.2GT/s,同时首次原生支持PCIe 4.0,通道数也从48条增加到64条。


独家的AVX-512指令集这次增加了大量的新指令,涉及到加解密、压缩解压、安全等各个方面,可扩大应用范围、提升性能,这也是Intel一贯的长项。





Intel还和新发布的AMD三代霄龙做了正面对比,强调了自己在缓存延迟、内存延迟方面的优势。


缓存延迟方面,新至强的一二级其实比三代霄龙还稍微高一些,但三级就完全不一样了,毕竟一个是单Die,一个是多芯片,不再同一个数量级,尤其是霄龙涉及到跨Die通信、跨处理器的时候,延迟可以达到新至强的两倍甚至五倍。


内存方面,新至强的通道数、频率算是追平对手,但是延迟低得多,而且有独家的傲腾持久内存加持,单颗处理器支持最多4TB DDR4内存,或者4TB DDR4+2TB傲腾内存。


三代霄龙最多支持3TB DDR4,其实也可以搭配傲腾内存,但最大容量仅为1.5TB,而且关乎运行模式、平台联动、指令和应用优化,估计几乎不会有客户会去这么搭配,AMD也坦承一切取决于客户自己的部署。——有点像Thunderbolt雷电技术。




指令集这个东西,一直都是Intel占据领导地位,这次也新增了大量新指令,包括大数算数(AVX-512整数IFMA)、矢量AES、Caryy-less乘法指令、伽罗华域新指令、SHA-NI、VBMI等等,就不展开讲了,大家只要看看后边的性能提升就明白它们的威力了。


很多时候,一条指令的加入,很容易就可以在特定负载中带来数倍乃至数十倍的性能提升,远不是单纯改进硬件就能媲美的。


Intel技术专家表示:“工作负载加速器指令就好比性能倍增器,它提供的增益要比仅向处理器添加核心所能带来的增益高很多。”


Intel副总裁兼至强处理器与存储事业部总经理Lisa Spelman也强调说:“几年前开始我们就开始早早投资指令集和软件,这个战略正在产生巨大的回报。”



安全也是数据中心必不可少的关键一环,新至强的一大重点就是支持SGX软件防护扩展技术,它面世已经好几年,这是第一次登陆至强可扩展平台,用于双路系统。


它具备持续增强的安全能力,并通过了数百次的调研和生产部署,可大大缩小系统内的攻击层面,抵御各种攻击途径,保护敏感代码和数据,而且指定位址空间可隔离并处理最多达1TB的代码与数据,满足主流工作负载的需求。


尤为值得一提的是,SGX安全技术是独立于操作系统、硬件配置的,不受软硬件变动的影响和约束,部署更方便,效果也更明显,即便是操作系统、BIOS、驱动、虚拟机都被攻击了,它依然能保护数据。


再结合全内存机密技术、平台固件弹性技术,新至强可以真正解决敏感的数据保护问题。



说了半天,大家可能会问,这次到底发布了什么产品?真的是相当相当丰盛。


如上图,最左侧一列是此前发布的四路、八路Cooper Lake,中间和右侧是新发布的单路、双路Ice Lake-SP,按照产品线分为铂金、金牌、银牌三个序列(没有了最低端的铜牌)。


按照应用方向,则分别注重单核性能、扩展性能、SGX安全性能、网络优化、云优化、媒体处理优化、长寿命、单路型、液冷散热等等,划分得非常细致,当然不同类型有所交错,有的型号可适用于多个方面。


Intel还为不同版本加上了不同的字母后缀,包括V(SaaS云)、P(IaaS云)、S(512GB SGX)、Q(液冷散热)、Y(SST-PP 2.0)、N(网络/网络虚拟优化)、M(媒体处理优化)、T(长寿命与扩展温度范围)、U(单路)等等,着实有点眼花缭乱。


顶级旗舰是至强铂金8380,40核心80线程,基准频率2.3GHz,全核加速3.0GHz、单核加速3.4GHz,二级缓存50MB,三级缓存60MB,热设计功耗270W,批发价8099美元。


相比之下,上代旗舰至强铂金8280 28核心56线程,频率2.7-4.0GHz,二级缓存28MB,三级缓存38.5MB,热设计功耗205W,批发价100009美元。


这代最强的28核心是至强金牌6348,频率2.6-3.5GHz,二级缓存35MB,三级缓存42MB,热设计功耗235W,价格3072美元。


两相对比,同样核心的时候,新一代频率低了不少,热设计功耗反而高了,这也是这代的普遍趋势,10nm对比炉火纯青的14nm还是差点劲,不过价格降到了只要三成!40核心也比上代28核心便宜了两成!


4/6核心型号取消,改为直接8核心起步,而基准频率最高3.6GHz的至强金牌6334,就是一款8核心,但这已经是极限了,最高加速此时也只有3.7GHz,而热设计功耗达到了165W,上代可是还有多款型号加速到了4.5GHz。


热设计功耗最低的也有105W,包括8核心的至强银牌4309Y、10核心的至强银牌4310T,频率分别为2.8-3.6GHz、2.3-3.4GHz。


另外注意有个特殊的液冷散热型至强铂金8368Q,38核心,频率2.6-3.7GHz,热设计功耗270W,可能是偏向OEM定制。


其他型号就不一一解读了,感兴趣的可以自己慢慢对比。






二、性能对比:花式吊打竞品


无论技术如何,最终还是要落地到实际性能上,不过Intel也一再强调,性能不是唯一,跑分更不是唯一。


Lisa Spelman表示:“CPU是客户购买决策的关键部分,但是这不是唯一的因素,其中最酷的因素之一就是让客户看到我们提供的整个产品组合。通过使用整个产品组合,客户能完成复杂而重要的购买决策。”


Intel市场营销集团副总裁、中国区数据中心销售总经理陈葆立也说:“我们之前做过一些调查,企业购买一个服务器最关心的是可靠性、稳定性、大规模部署的实力。至强已经有5000万颗的出货量,非常多软件开发商已经有很多版本的优化软件,这对客户来而言是非常大的一个吸引力。对于至强或者是x86的竞争力,我们都非常有信心。


这也是刚才我们反复提到Intel同步在FPGA、内存、硬盘、网络等产品上更新换代的一个注脚,此外也少不了制造、产能、供应方面的优势。如今的Intel,打的是一套组合拳。


当然,性能是不能回避的,Intel也展示了一系列数据,突出了对比上代的巨大提升,以及对比竞品的优势。





根据Intel给出的数字,Ice Lake-SP三代可扩展至强相比于Cascade Lake二代产品,性能提升的几何平均值是46%,这已经是飞跃一般的数字了,而且部分特定负载的提升幅度还更高,尤其是在AI人工智能、ML机器学习加速的情况下。


比如云负载提升最多达50%,5G网络提升最多62%,IoT物联网提升最多56%,HPC高性能计算提升最多57%,AI提升最多74%(但后边你会发现这个数字其实是很保守的),整数性能提升最多50%,浮点性能提升最多52%,内存带宽提升最多47%,LinPack计算性能提升最多38%,



Intel甚至还对比了Skylake(六代酷睿)架构的一代可扩展至强,以及Broadwell(代酷睿)至强E5 v4系列、Haswell(四代酷睿)至强E5 v3系列的提升幅度,自然是两三倍的变化。


你可能会觉得这样太欺负老平台了,只是为了彰显提升幅度巨大,其实非也。


即便在消费平台,绝大多数人都不会每代跟着升级,间隔一两代甚至三代换新的大有人在,用着五年前老机器的不在少数,追求稳定可靠、在意成本的服务器、数据中心领域就更是如此了,必须有足够让客户心动的变化才会促使更新换代。




前文说到,Ice Lake-SP是目前唯一內建AI加速的x86数据中心处理器,这方面在特定负载上的提升是极为明显的,比如加密加速开启后可骤升4.2倍,VNNI深度学习学习指令集也能猛涨4.3倍。


机器学习和深度学习这块,也是效果斐然,包括图像识别、图像分类、语言处理,这种在我们日常应用背后默默工作的负载,都能轻松获得40-60%的大幅度提升。



对比竞品,这种独有的优势更是碾压一般的存在,20项流行AI、ML负载负载相比于AMD顶级的霄龙7763、NVIDIA A100加速卡分别领先多达50%、30%,其中图像识别更是25倍于64核心的霄龙7763。


还有软件方面的广泛合作、深度优化,10倍、100倍的性能变化都不难。


Lisa Spelma直言:“在某些情况下,通过软件优化,我们的处理器的性能会比发布的时候有所提升。对我们来说,关键的改变重点和战略是在我们交付的产品性能基础之上进行部署优化,而不是让我们的客户或者是解决方案团队直接转移到下一代产品的开发上去。”


双路至强铂金8380对比双路霄龙7763,虽然核心数是80个对128个少了三分之一,但性能依然很秀,尤其是AI推理,最高的达到了恐怖的25倍。



生态方面更不用说了,几乎没有不臣服于Intel平台的,新至强在全球已有超过5000个合作伙伴方案,从云端到边缘端全覆盖。


同时,50多家OEM/ODM伙伴已经准备好了超过250项设计、所有的顶级云服务商都正在或计划部署新至强、超过15家大型网络厂商已经初步或即将部署新至强、超过20家高性能计算厂商已经部署新至强、200多家独立软件供应商和伙伴已经支持SGX安全技术……








本次中国区发布会,就有多达42家中国合作伙伴云集,而在发布会上,阿里云、移动云、腾讯云、百度云等国内巨头,也纷纷介绍了自己的新至强平台方案,以及新平台带来的改进和提升。


接下来欣赏一组Intel官方放出的Ice Lake-SP处理器和晶圆美图,还有配套的傲腾内存、傲腾SSD、闪存SSD、网卡……












Ice Lake-SP晶圆








傲腾持久内存PMem 200



傲腾持久内存PMem 200



SSD D7-P5510(144层TLC)



SSD D5-P5316(144层QLC)



E810-2CQDA2网卡



E810-2CQDA2网卡



Agilex FPGA



Ice Lake-SP服务器




硬件世界 共同研究探讨硬件知识及相关信息
评论
  •     IPC-2581是基于ODB++标准、结合PCB行业特点而指定的PCB加工文件规范。    IPC-2581旨在替代CAM350格式,成为PCB加工行业的新的工业规范。    有一些免费软件,可以查看(不可修改)IPC-2581数据文件。这些软件典型用途是工艺校核。    1. Vu2581        出品:Downstream     
    电子知识打边炉 2025-01-22 11:12 55浏览
  • 随着消费者对汽车驾乘体验的要求不断攀升,汽车照明系统作为确保道路安全、提升驾驶体验以及实现车辆与环境交互的重要组成,日益受到业界的高度重视。近日,2024 DVN(上海)国际汽车照明研讨会圆满落幕。作为照明与传感创新的全球领导者,艾迈斯欧司朗受邀参与主题演讲,并现场展示了其多项前沿技术。本届研讨会汇聚来自全球各地400余名汽车、照明、光源及Tier 2供应商的专业人士及专家共聚一堂。在研讨会第一环节中,艾迈斯欧司朗系统解决方案工程副总裁 Joachim Reill以深厚的专业素养,主持该环节多位
    艾迈斯欧司朗 2025-01-16 20:51 198浏览
  • 嘿,咱来聊聊RISC-V MCU技术哈。 这RISC-V MCU技术呢,简单来说就是基于一个叫RISC-V的指令集架构做出的微控制器技术。RISC-V这个啊,2010年的时候,是加州大学伯克利分校的研究团队弄出来的,目的就是想搞个新的、开放的指令集架构,能跟上现代计算的需要。到了2015年,专门成立了个RISC-V基金会,让这个架构更标准,也更好地推广开了。这几年啊,这个RISC-V的生态系统发展得可快了,好多公司和机构都加入了RISC-V International,还推出了不少RISC-V
    丙丁先生 2025-01-21 12:10 115浏览
  • 日前,商务部等部门办公厅印发《手机、平板、智能手表(手环)购新补贴实施方案》明确,个人消费者购买手机、平板、智能手表(手环)3类数码产品(单件销售价格不超过6000元),可享受购新补贴。每人每类可补贴1件,每件补贴比例为减去生产、流通环节及移动运营商所有优惠后最终销售价格的15%,每件最高不超过500元。目前,京东已经做好了承接手机、平板等数码产品国补优惠的落地准备工作,未来随着各省市关于手机、平板等品类的国补开启,京东将第一时间率先上线,满足消费者的换新升级需求。为保障国补的真实有效发放,基于
    华尔街科技眼 2025-01-17 10:44 221浏览
  • 数字隔离芯片是一种实现电气隔离功能的集成电路,在工业自动化、汽车电子、光伏储能与电力通信等领域的电气系统中发挥着至关重要的作用。其不仅可令高、低压系统之间相互独立,提高低压系统的抗干扰能力,同时还可确保高、低压系统之间的安全交互,使系统稳定工作,并避免操作者遭受来自高压系统的电击伤害。典型数字隔离芯片的简化原理图值得一提的是,数字隔离芯片历经多年发展,其应用范围已十分广泛,凡涉及到在高、低压系统之间进行信号传输的场景中基本都需要应用到此种芯片。那么,电气工程师在进行电路设计时到底该如何评估选择一
    华普微HOPERF 2025-01-20 16:50 73浏览
  • 临近春节,各方社交及应酬也变得多起来了,甚至一月份就排满了各式约见。有的是关系好的专业朋友的周末“恳谈会”,基本是关于2025年经济预判的话题,以及如何稳定工作等话题;但更多的预约是来自几个客户老板及副总裁们的见面,他们为今年的经济预判与企业发展焦虑而来。在聊天过程中,我发现今年的聊天有个很有意思的“点”,挺多人尤其关心我到底是怎么成长成现在的多领域风格的,还能掌握一些经济趋势的分析能力,到底学过哪些专业、在企业管过哪些具体事情?单单就这个一个月内,我就重复了数次“为什么”,再辅以我上次写的:《
    牛言喵语 2025-01-22 17:10 46浏览
  • 本文介绍瑞芯微开发板/主板Android配置APK默认开启性能模式方法,开启性能模式后,APK的CPU使用优先级会有所提高。触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。源码修改修改源码根目录下文件device/rockchip/rk3562/package_performance.xml并添加以下内容,注意"+"号为添加内容,"com.tencent.mm"为AP
    Industio_触觉智能 2025-01-17 14:09 164浏览
  • 高速先生成员--黄刚这不马上就要过年了嘛,高速先生就不打算给大家上难度了,整一篇简单但很实用的文章给大伙瞧瞧好了。相信这个标题一出来,尤其对于PCB设计工程师来说,心就立马凉了半截。他们辛辛苦苦进行PCB的过孔设计,高速先生居然说设计多大的过孔他们不关心!另外估计这时候就跳出很多“挑刺”的粉丝了哈,因为翻看很多以往的文章,高速先生都表达了过孔孔径对高速性能的影响是很大的哦!咋滴,今天居然说孔径不关心了?别,别急哈,听高速先生在这篇文章中娓娓道来。首先还是要对各位设计工程师的设计表示肯定,毕竟像我
    一博科技 2025-01-21 16:17 102浏览
  • 2024年是很平淡的一年,能保住饭碗就是万幸了,公司业绩不好,跳槽又不敢跳,还有一个原因就是老板对我们这些员工还是很好的,碍于人情也不能在公司困难时去雪上加霜。在工作其间遇到的大问题没有,小问题还是有不少,这里就举一两个来说一下。第一个就是,先看下下面的这个封装,你能猜出它的引脚间距是多少吗?这种排线座比较常规的是0.6mm间距(即排线是0.3mm间距)的,而这个规格也是我们用得最多的,所以我们按惯性思维来看的话,就会认为这个座子就是0.6mm间距的,这样往往就不会去细看规格书了,所以这次的运气
    wuliangu 2025-01-21 00:15 186浏览
  •  光伏及击穿,都可视之为 复合的逆过程,但是,复合、光伏与击穿,不单是进程的方向相反,偏置状态也不一样,复合的工况,是正偏,光伏是零偏,击穿与漂移则是反偏,光伏的能源是外来的,而击穿消耗的是结区自身和电源的能量,漂移的载流子是 客席载流子,须借外延层才能引入,客席载流子 不受反偏PN结的空乏区阻碍,能漂不能漂,只取决于反偏PN结是否处于外延层的「射程」范围,而穿通的成因,则是因耗尽层的过度扩张,致使跟 端子、外延层或其他空乏区 碰触,当耗尽层融通,耐压 (反向阻断能力) 即告彻底丧失,
    MrCU204 2025-01-17 11:30 182浏览
  •  万万没想到!科幻电影中的人形机器人,正在一步步走进我们人类的日常生活中来了。1月17日,乐聚将第100台全尺寸人形机器人交付北汽越野车,再次吹响了人形机器人疯狂进厂打工的号角。无独有尔,银河通用机器人作为一家成立不到两年时间的创业公司,在短短一年多时间内推出革命性的第一代产品Galbot G1,这是一款轮式、双臂、身体可折叠的人形机器人,得到了美团战投、经纬创投、IDG资本等众多投资方的认可。作为一家成立仅仅只有两年多时间的企业,智元机器人也把机器人从梦想带进了现实。2024年8月1
    刘旷 2025-01-21 11:15 412浏览
  • Ubuntu20.04默认情况下为root账号自动登录,本文介绍如何取消root账号自动登录,改为通过输入账号密码登录,使用触觉智能EVB3568鸿蒙开发板演示,搭载瑞芯微RK3568,四核A55处理器,主频2.0Ghz,1T算力NPU;支持OpenHarmony5.0及Linux、Android等操作系统,接口丰富,开发评估快人一步!添加新账号1、使用adduser命令来添加新用户,用户名以industio为例,系统会提示设置密码以及其他信息,您可以根据需要填写或跳过,命令如下:root@id
    Industio_触觉智能 2025-01-17 14:14 122浏览
  • 现在为止,我们已经完成了Purple Pi OH主板的串口调试和部分配件的连接,接下来,让我们趁热打铁,完成剩余配件的连接!注:配件连接前请断开主板所有供电,避免敏感电路损坏!1.1 耳机接口主板有一路OTMP 标准四节耳机座J6,具备进行音频输出及录音功能,接入耳机后声音将优先从耳机输出,如下图所示:1.21.2 相机接口MIPI CSI 接口如上图所示,支持OV5648 和OV8858 摄像头模组。接入摄像头模组后,使用系统相机软件打开相机拍照和录像,如下图所示:1.3 以太网接口主板有一路
    Industio_触觉智能 2025-01-20 11:04 153浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦