盘点国产服务器和处理器架构

智能计算芯世界 2021-09-02 00:00



服务器是一种为客户机提供服务的高性能计算机。关于服务器最全分析材料请参考文章“终极版:服务器基础知识全解(182页PPT”。


CPU作为服务器的运算和控制核心其指令集架构有CISC和RISC两种从性能角度来说CISC与RISC并无绝对的孰优孰劣之分目前看来CISC与RISC已逐步走向融合两方处理器互相借鉴互相优化目前X86架构CPU占整体服务器市场约 96%处于绝对领先的地位

以ARM为代表的国产架构服务器有望异军突起ARM早期专注低功耗领域在移动端处于领先位置生态体系十分完善但在服务器等计算市场多年来推进缓慢随着多核异构计算时代和场景多样化计算时代到来带来对计算架构多样性的需求考虑中国市场政府金融能源等行业端生态逐步完善以及华为鲲鹏的入局以ARM为代表的国产架构服务器有望获得一席之地而ARM公司本身也推出了Neoverse新架构以期大幅提升性能增强在服务器领域的竞争力

国产架构服务器群雄逐鹿目前国产CPU包括鲲鹏飞腾海光龙芯兆芯宏芯申威等在党政军领域龙芯飞腾兆芯等目前占据主流华为鲲鹏未来有望在商用市场占据主导海光凭借其出色的单核性能和X86完善生态也有望获得一定市场份额



服务器行业发展简史


1.1 服务器一种为客户机提供服务的高性能计算机


服务器是指网络环境中的高性能计算机包括应用程序服务器文档服务器邮件服务器Web服务器及代理服务器等整个互联网的结构几乎都基于客户机-服务器模型客户机-服务器模型的本质是客户机请求服务器响应即服务器的功能是为客户机提供数据服务服务器由处理器CPU内存磁盘网卡监视器电源机箱等组成和通用的计算机架构类似但是由于需要提供高可靠的服务因此在处理能力稳定性可靠性安全性可扩展性可管理性等方面的要求比普通的个人电脑高
服务器的最大特点就是其强大的运算能力即使是一部简单的服务器系统通常也至少要有两颗处理器以构成对称多处理架构使其能在短时间内完成大量工作并为大量用户提供服务

服务器常见的外型有四种塔式服务器(Tower Server)机架服务器(Rack Server)刀片服务器Blade Server机柜式服务器其中机柜是指为服务器正常工作提供相适应的环境和安全防护的安装箱通过机柜可以保证服务器设备稳定可靠地工作



服务器行业已经发展了近60年服务器的发展最早可以追溯到1964年IBM引入System/360System/360是由5种功能越来越强大的计算机所组成的系列这些计算机运行同一操作系统并能够使用相同的44个外围设备



1.2 CPU服务器的运算和控制核心


中央处理器(Central Processing Unit简称CPU)是服务器的核心构成之一其功能主要是解释计算机指令以及处理服务器中的数据CPU的主要运作原理是执行储存程序里的一系列指令程序以一系列数字的形式存储在存储器中

指令集架构Instruction Set Architecture又称指令集或指令集体系是计算机体系结构中与程序设计有关的部分包含了基本数据类型指令集寄存器寻址模式存储体系中断异常处理以及外部I/O指令集架构包含一系列的opcode即操作码机器语言以及由特定处理器执行的基本命令简单地来说指令集一般被整合在操作系统内核最底层的硬件抽象层中属于计算机中硬件与软件的接口它向操作系统定义了CPU的基本功能

CPU按指令集的架构区分分为CISCComplex Instruction Set Computing复杂指令集型和RISCReduced Instruction Set Computing精简指令集型两类


CISC的设计者希望通过直接在硬件中构建复杂的指令从而使编程更方便程序运行速度更快其架构中每个指令可执行若干低端操作诸如从存储器读取存储和计算操作全部集于单一指令之中与之相反RISC架构中只包含使用频率高的少量简单指令并提供一些必要的指令以支持操作系统和高级语言

CISC阵营以IntelAMD的X86架构为代表而RISC阵营则包括ARMMIPSPower PC等架构;

从硬件角度来讲CISC处理的是不等长指令集而RISC执行的是等长精简指令集在并行处理方面RISC明显优于CISC由于RISC执行的是精简指令集相比CISC在硬件层面需要更少的晶体管所以它的硬件制造工艺更简单且成本更低廉RISC型CPU与CISC的CPU在软件和硬件上都不兼容这是由指令集的特性而决定的。

从性能角度来说CISC与RISC并无绝对的孰优孰劣之分但在发展过程中CISC阵营的Intel和AMD在提升芯片性能上做出了持续的努力芯片的功耗被放在了性能后的第二位而RISC本身出现时间较CISC晚十年左右ARM诞生于1985年X86诞生于1978年ARMMIPS在创始初期缺乏与Intel产品对抗的实力专注于以低功耗为前提的高性能芯片RISC阵营的Power PC架构最初是为个人计算机产品而设计但其出现时已是1992年此时Intel旗下的80386和80486占据了大部分PC市场


次年Intel赫赫有名的奔腾系列发布并助力Intel占领了绝大部分PC市场这是第五代基于CISC的X86架构微处理器Intel将其命名为Pentium在整个1990年代中期PowerPC处理器均达到或超过了最快的x86 CPU的基准测试成绩

但由于PowerPC面向WindowsOS / 2和Sun的客户都存在应用软件极度缺乏的问题所以最终并未在PC市场溅起水花但其后Apple因为PowerPC处理器的更高性能在Macintosh个人电脑系列使用了PowerPC处理器

2005年出于发热量和能源消耗有关的考虑Apple宣布不再在其Apple Macintosh计算机中使用PowerPC处理器转而支持Intel生产的处理器此后PowerPC开始往超高性能服务器方向发展


CISC与RISC已逐步走向融合两方处理器互相借鉴互相优化例如Intel公司的Pentium Pro种内含三个能够把x86指令转换成118位定长的RISC风格微操作的译码器



1.3 X86一统天下数十年


X86泛指一系列英特尔公司用于开发处理器的指令集架构该系列较早期的处理器名称是以数字来表示80X86包括Intel 8086801868028680386以及80486由于以86作为结尾因此其架构被称为X86



X86在计算市场取胜的原因主要有以下四点


Intel与AMD竞争不断造就高性能X86Intel具有很强的研发实力芯片性能一直处于行业领先在20世纪70年代至21世纪初,厂商最看重的因素之一即为处理器的性能而RISC本身出现时间较CISC晚十年左右ARMMIPS在创始初期缺乏与Intel产品对抗的实力改以专注于以低功耗为前提的高性能芯片

同时Intel X86也很早开始借鉴RISC架构优势不断技术革新比如Pentium奔腾处理器就采用了超标量架构即有一个处理简单和通用指令的管线Intel最新产品十代酷睿桌面版Comet Lake-S系列处理器及400系芯片组中最低配置的酷睿i3-10100四核处理器已经达到3.6GHz基础频率4.3GHz睿频全核4.1GHz从单机性能上来讲Intel目前依旧处于强势地位

Wintel联盟建立四十余年X86软件生态完善1981年由于个人计算机市场不受IBM看重IBM选取8088做个人计算机业务的CPU并将操作系统外包给微软Wintel联盟就此开始征程


在Wintel建立之初微软并没有打算唯一地只支持Intel早期微软操作系统有两条业务线一条专用支持X86架构另一条则支持考虑了操作系统的可移植性可支持RISC架构的计算机但由于RISC处理器在PC端的份额远不及X86微软又取消了对部分RISC架构的支持后来X86成为了个人电脑的标准平台也成为了历来市场上最成功的CPU架构

专注芯片架构研发不碰设备生态就Intel来讲不与设备生产商软件开发者或者系统开发者成为利益竞争关系是一个十分重要的致胜因素IBM和SUM大包大揽生产多种服务器设备但其它设备生产商可能会基于不支持竞争对手的角度不愿意选择PowerPC和SPARC架构而选择X86架构


从成本性能生态三方面来讲X86都是早期数据中心的最优选从成本和性能角度来讲X86相比大型机与小型机在RAS(Reliability, Availability, Serviceability)有所欠缺但具有生态系统开放兼容性高价格便宜的优势且由于分布式系统成熟X86服务器集群的性能并无较大差距大型机和小型机价格昂贵体系封闭一般只在部分要求零宕机的领域使用如银行业电信业等

从生态的角度来讲由于X86在市场上占有率高相比其它架构而言X86有着独一无二的软件和硬件生态优势故目前全球的数据中心大部分都是采用Intel的X86架构服务器芯片X86生态系统也愈发强大

根据DRAMeXchange调查显示服务器用CPU中X86架构CPU占整体服务器市场约 96%



以ARM为代表的CISC架构服务器有望异军突起


2.1 ARM公司全球领先的半导体设计与软件公司


ARM架构从1983年开始由艾康电脑公司设计开发最早为其命名为Acorn精简指令集机器(Acorn RISC Machine)1980年代晚期苹果电脑开始与艾康电脑合作开发新版的ARM核心为了更好地支持这一重要项目艾康电脑将设计团队组成了一间名为安谋国际科技(Advanced RISC Machines Ltd.)的新公司基于此原因人们也常常将ARM称作高级精简指令集机器(Advanced RISC Machine)但在2016年安谋国际科技被日本软银集团以3.3万亿日元约合311亿美元收购此后ARM公司退出股市



不同于Intel自主完成架构芯片设计和芯片制造也不同于无工厂模式(Fabless)的AMDNVIDIA自己完成架构和芯片设计而将芯片制造工作交给代工厂完成ARM公司本身并不靠自有的设计来制造或出售CPU而是通过提供各种授权条款来获得收益



ARM公司一般有三种授权方式指令集授权内核授权和使用权授权

指令集授权是ARM公司提供的最大限度的授权其产品形式为ARM v系列即ARM架构被授权方可以对ARM公司的指令集进行扩展或缩减从而得到其自己的指令集架构苹果公司就取得了这种授权例如iphone 11/ 11 pro/ 11 pro Max等机型上搭载的Apple A13芯片其微架构就是基于ARMv8.3-A指令集架构自主研发此外华为长城高通三星等公司也取得了ARM的指令集授权

内核授权的产品主要是指ARM公司提供的一系列微架构目前主要是ARM cortex系列被授权方可以在内核基础上对缓存I/O等设计进行修改这是ARM公司提供的最广泛的授权方式ARM是广为人知最昂贵的CPU内核之一取得这种授权的公司包括高通三星华为德州仪器(TI)博通飞思卡尔富士通以及Calxeda等等

使用权授权的产品则是指ARM已经设计好的CPU/GPU被授权人可以使用ARM设计好的CPU/GPU在这一种授权中被授权人可自由发挥的空间非常小



2.2 ARM架构已被广泛应用到各个领域


ARM公司的商业发展极其迅速主要有以下几点原因

发展早期避开Intel锋芒专注低功耗领域ARM公司发展之初也在个人计算机领域做出了努力但后来发现其产品与Intel的新品无法竞争之后迅速转换路径投入了以低功耗为前提的高性能芯片的研发早期清晰的发展路线也为ARM之后抓住智能手机爆发机遇做好了铺垫

授权策略正确内核授权价格低厂商间竞争激烈1991年ARM公司就开始了授权模式MIPS的定价策略是内核授权很贵而架构授权很便宜且对指令集扩展不受限制而ARM的定价策略是架构授权非常昂贵而内核授权很便宜且厂商需要修改设计需要继续付大量的费用

从实践结果来看ARM的授权策略优于MIPSMIPS便宜的架构授权吸引了一批有能力通过指令集开发CPU的厂商但由于允许厂商自行修改指令集导致生态碎片化且互相不兼容也极大影响了开发者和使用者的热情而ARM的授权模式对无能力通过指令集开发CPU的厂商十分友好这些厂商能通过购买内核授权来快速推出CPU产品甚至有研发能力的公司也愿意使用现成的ARM内核来集成CPU从而大幅度降低产品开发成本和缩短开发周期ARM的商业模式也使得进入厂商多激烈的竞争使得ARM产品价格不断下降生态日趋完善


完善的生态体系ARM完善的硬软件生态使得设备厂商开发者和使用者都充满信心

ARM架构的应用领域已十分广泛据2011年ARM的客户报告统计79亿ARM处理器出货量占有95%的智能手机90%的硬盘驱动器40%的数字电视和机上盒15%的微控制器和20%的移动电脑十年来ARM市场格局变化不大截止到2017年已经生产的ARM架构的处理器超过1000亿个是应用最广泛的指令集架构也是产量最大的指令集架构

由于ARM在成本功耗和散热上的优势它对于便携式电池供电的设备包括智能手机便携式计算机和平板电脑以及其他嵌入式系统来说十分理想同时对于消耗大量电力的超级计算机与云计算数据中心ARM也是一种节能的优秀解决方案目前ARM处理器可以在很多消费性电子产品上看到从便携式设备PDA移动电话多媒体播放器掌上型电子游戏和计算机到电脑外设硬盘桌面型路由器甚至在导弹的弹载计算机等军用设施中都有它的存在在此之外还有一些基于ARM设计的衍生产品包括Marvell的XScale架构和德州仪器的OMAP系列



2016年日本富士通宣布了研发接替Post-K超级计算机Post-K超级计算机采用富士通与ARM公司共同开发的ARM处理器A64FX富士通称他们目标是创造出世界上最高性能的超级计算机其应用执行性能是京超级计算机的100倍如果此应用执行速度实现那么Post-K超算将进入百亿亿次级别exascale1 exaflops表示每秒10^18次浮点运算



2.3 ARM在服务器领域的尝试


从2008年开始ARM公司开始酝酿进军ARM服务器芯片市场的计划此后AMD三星AWS高通Calxeda以及Marvell等多个公司相继开发了ARM架构服务器芯片但除AWS以外其余公司的ARM服务器芯片均未在市场上有持续表现

AWS推出基于ARM架构的云计算服务AWS在2018年正式对外发布了基于ARM架构的云服务器芯片Graviton及基于该芯片提供的EC2 A1虚拟服务器和云服务并表示此芯片对部分工作负载能耗可降低45%在2019年12月的AWS re:Invent 会议上亚马逊公布了新一代的ARM 服务器芯片 Graviton2据介绍AWS Graviton 2 处理器的速度比较前一代芯片提升了7倍浮点性能提升了2倍性能表现强悍

AMD三星高通Calxeda以及Marvell等公司在ARM服务器芯片上的尝试均未获得成功



从AWS和Marvell的实践观察在云计算领域ARM架构芯片低功耗低成本的优势不可小觑但AMD三星高通Calxeda以及Marvell五个公司在ARM服务器芯片领域均未获得成功我们认为主要有以下两方面原因

ARM在服务器领域的生态并不成熟Wintel联盟牢牢垄断计算产业生态各类厂商更倾向于X86架构故ARM服务器在市场推广方面存在较大阻力

ARM服务器芯片是一个需要持续投入的产业如高通三星可能出于对当时情况的判断认为ARM服务器暂时不具备良好的市场前景故放弃了此业务

X86服务器相较于ARM服务器而言具有性能强的优势但同时也具有功耗大成本高的劣势因此ARM已经明确了其针对数据中心的Neoverse架构迭代升级策略每一代性能提升都在30%以上远超X86 CPU每一代性能提升的幅度ARM与X86之间性能上的差距将不断缩小



近几年ARM性能提升的同时其生态也得到了较大的扩展2018年11月开始Windows已经开始支持64位ARM应用开发和提交这将十分有利于ARM生态的构建

2019年6月在德国法兰克福国际超算大会上NVIDIA宣布支持Arm CPU以构建具有极高能效水平的百万兆级AI超级计算机NVIDIA创始人兼首席执行官黄仁勋表示NVIDIA CUDA加速的计算和Arm的高能效CPU架构的相结合将助力HPC社区实现大幅提升以达到百万兆级

Arm架构服务器的开源应用

Arm架构服务器和存储

服务器硬件体系架构浅析

服务器市场现状研究


推荐阅读:

  • 终极版:服务器基础知识全解(182页PPT)





免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。


电子书<服务器基础知识全解(终极版)>更新完毕,知识点深度讲解,提供182页完整版下载。

获取方式:点击“阅读原文”即可查看PPT可编辑版本和PDF阅读版本详情。


温馨提示:

请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。


智能计算芯世界 聚焦人工智能、芯片设计、异构计算、高性能计算等领域专业知识分享.
评论
  • 《高速PCB设计经验规则应用实践》+PCB绘制学习与验证读书首先看目录,我感兴趣的是这一节;作者在书中列举了一条经典规则,然后进行详细分析,通过公式推导图表列举说明了传统的这一规则是受到电容加工特点影响的,在使用了MLCC陶瓷电容后这一条规则已经不再实用了。图书还列举了高速PCB设计需要的专业工具和仿真软件,当然由于篇幅所限,只是介绍了一点点设计步骤;我最感兴趣的部分还是元件布局的经验规则,在这里列举如下:在这里,演示一下,我根据书本知识进行电机驱动的布局:这也算知行合一吧。对于布局书中有一句:
    wuyu2009 2024-11-30 20:30 141浏览
  • 戴上XR眼镜去“追龙”是种什么体验?2024年11月30日,由上海自然博物馆(上海科技馆分馆)与三湘印象联合出品、三湘印象旗下观印象艺术发展有限公司(下简称“观印象”)承制的《又见恐龙》XR嘉年华在上海自然博物馆重磅开幕。该体验项目将于12月1日正式对公众开放,持续至2025年3月30日。双向奔赴,恐龙IP撞上元宇宙不久前,上海市经济和信息化委员会等部门联合印发了《上海市超高清视听产业发展行动方案》,特别提到“支持博物馆、主题乐园等场所推动超高清视听技术应用,丰富线下文旅消费体验”。作为上海自然
    电子与消费 2024-11-30 22:03 103浏览
  • 概述 说明(三)探讨的是比较器一般带有滞回(Hysteresis)功能,为了解决输入信号转换速率不够的问题。前文还提到,即便使能滞回(Hysteresis)功能,还是无法解决SiPM读出测试系统需要解决的问题。本文在说明(三)的基础上,继续探讨为SiPM读出测试系统寻求合适的模拟脉冲检出方案。前四代SiPM使用的高速比较器指标缺陷 由于前端模拟信号属于典型的指数脉冲,所以下降沿转换速率(Slew Rate)过慢,导致比较器检出出现不必要的问题。尽管比较器可以使能滞回(Hysteresis)模块功
    coyoo 2024-12-03 12:20 153浏览
  • 光伏逆变器是一种高效的能量转换设备,它能够将光伏太阳能板(PV)产生的不稳定的直流电压转换成与市电频率同步的交流电。这种转换后的电能不仅可以回馈至商用输电网络,还能供独立电网系统使用。光伏逆变器在商业光伏储能电站和家庭独立储能系统等应用领域中得到了广泛的应用。光耦合器,以其高速信号传输、出色的共模抑制比以及单向信号传输和光电隔离的特性,在光伏逆变器中扮演着至关重要的角色。它确保了系统的安全隔离、干扰的有效隔离以及通信信号的精准传输。光耦合器的使用不仅提高了系统的稳定性和安全性,而且由于其低功耗的
    晶台光耦 2024-12-02 10:40 134浏览
  • 遇到部分串口工具不支持1500000波特率,这时候就需要进行修改,本文以触觉智能RK3562开发板修改系统波特率为115200为例,介绍瑞芯微方案主板Linux修改系统串口波特率教程。温馨提示:瑞芯微方案主板/开发板串口波特率只支持115200或1500000。修改Loader打印波特率查看对应芯片的MINIALL.ini确定要修改的bin文件#查看对应芯片的MINIALL.ini cat rkbin/RKBOOT/RK3562MINIALL.ini修改uart baudrate参数修改以下目
    Industio_触觉智能 2024-12-03 11:28 104浏览
  • 最近几年,新能源汽车愈发受到消费者的青睐,其销量也是一路走高。据中汽协公布的数据显示,2024年10月,新能源汽车产销分别完成146.3万辆和143万辆,同比分别增长48%和49.6%。而结合各家新能源车企所公布的销量数据来看,比亚迪再度夺得了销冠宝座,其10月新能源汽车销量达到了502657辆,同比增长66.53%。众所周知,比亚迪是新能源汽车领域的重要参与者,其一举一动向来为外界所关注。日前,比亚迪汽车旗下品牌方程豹汽车推出了新车方程豹豹8,该款车型一上市就迅速吸引了消费者的目光,成为SUV
    刘旷 2024-12-02 09:32 131浏览
  • 当前,智能汽车产业迎来重大变局,随着人工智能、5G、大数据等新一代信息技术的迅猛发展,智能网联汽车正呈现强劲发展势头。11月26日,在2024紫光展锐全球合作伙伴大会汽车电子生态论坛上,紫光展锐与上汽海外出行联合发布搭载紫光展锐A7870的上汽海外MG量产车型,并发布A7710系列UWB数字钥匙解决方案平台,可应用于数字钥匙、活体检测、脚踢雷达、自动泊车等多种智能汽车场景。 联合发布量产车型,推动汽车智能化出海紫光展锐与上汽海外出行达成战略合作,联合发布搭载紫光展锐A7870的量产车型
    紫光展锐 2024-12-03 11:38 121浏览
  • 11-29学习笔记11-29学习笔记习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-02 23:58 90浏览
  • TOF多区传感器: ND06   ND06是一款微型多区高集成度ToF测距传感器,其支持24个区域(6 x 4)同步测距,测距范围远达5m,具有测距范围广、精度高、测距稳定等特点。适用于投影仪的无感自动对焦和梯形校正、AIoT、手势识别、智能面板和智能灯具等多种场景。                 如果用ND06进行手势识别,只需要经过三个步骤: 第一步&
    esad0 2024-12-04 11:20 89浏览
  • 作为优秀工程师的你,已身经百战、阅板无数!请先醒醒,新的项目来了,这是一个既要、又要、还要的产品需求,ARM核心板中一个处理器怎么能实现这么丰富的外围接口?踌躇之际,你偶阅此文。于是,“潘多拉”的魔盒打开了!没错,USB资源就是你打开新世界得钥匙,它能做哪些扩展呢?1.1  USB扩网口通用ARM处理器大多带两路网口,如果项目中有多路网路接口的需求,一般会选择在主板外部加交换机/路由器。当然,出于成本考虑,也可以将Switch芯片集成到ARM核心板或底板上,如KSZ9897、
    万象奥科 2024-12-03 10:24 86浏览
  • RDDI-DAP错误通常与调试接口相关,特别是在使用CMSIS-DAP协议进行嵌入式系统开发时。以下是一些可能的原因和解决方法: 1. 硬件连接问题:     检查调试器(如ST-Link)与目标板之间的连接是否牢固。     确保所有必要的引脚都已正确连接,没有松动或短路。 2. 电源问题:     确保目标板和调试器都有足够的电源供应。     检查电源电压是否符合目标板的规格要求。 3. 固件问题: &n
    丙丁先生 2024-12-01 17:37 111浏览
  •         温度传感器的精度受哪些因素影响,要先看所用的温度传感器输出哪种信号,不同信号输出的温度传感器影响精度的因素也不同。        现在常用的温度传感器输出信号有以下几种:电阻信号、电流信号、电压信号、数字信号等。以输出电阻信号的温度传感器为例,还细分为正温度系数温度传感器和负温度系数温度传感器,常用的铂电阻PT100/1000温度传感器就是正温度系数,就是说随着温度的升高,输出的电阻值会增大。对于输出
    锦正茂科技 2024-12-03 11:50 135浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦