早年有个遥远的传说,80年代首款由英国Acorn Computers设计的微处理器ARM1问世。ARM1芯片后续是作为BBC Micro微计算机中的协处理器存在的,当时是BBC Computer Literacy Project研究开发项目,并未商业化。
据说这颗芯片的流片原型在首次测试的时候,顺利跑起来了,但电流计显示不出读数。结果发现芯片根本就没上电,那怎么跑起来的?原来这颗芯片是从测试板I/O的漏电获得的电——低功耗低到这个程度是万没想到的。Acorn原本预设了ARM1是颗低功耗芯片,功率设定1W,但实际最终平均功耗低于100mW。
来源:Twitter @kenshirriff
这个小“事故”应该也为Arm在低功耗芯片领域发展,奠定了传奇般的基础。Arm这家公司后续发展,似乎也始终围绕着“低功耗”展开——早年这种低功耗并不被重视,直到如今的电池供应设备如此之多,智能手机、可穿戴及各种IoT设备,海量采用Arm架构的芯片。
3月18日将由Aspencore在上海举办的2021中国IC领袖峰会上,将有更多相关IC设计的专家参与,点击链接报名,面对面与更多IC设计专家交流。
在此之前,不妨回顾一下Arm在低功耗另一面,高性能领域的探索和潜力展望。PC个人计算机,就是Arm试探了十多年,才初见成效的一个方向。可见从低功耗,走向高性能有多不易。而这刚刚开启的一步,大概已经是成功的一半了。本文主体以PC为观察角度,来谈谈Arm在低功耗领域之外持续了十多年的尝试。
微软的“红杏出墙”
近代PC的主流,也就是以macOS和Windows这两个操作系统为代表了。如果只讨论桌面(及服务器)平台的Windows,微软的这个操作系统是有多指令集支持的历史的。Windows NT 4.0及后续更新除了支持x86以外,也对PowerPC、DEC Alpha和MIPS提供支持。不过从Windows 2000开始,微软就彻底抛弃了x86以外的其他平台。Windows早年历史和Arm关联不大(除了像Windows CE这种嵌入式系统),毕竟桌面与服务器平台那时更需求高性能,而对功耗不像现在这么敏感。
微软与Arm比较众所周知的融合发生在2011年的CES展上,算起来刚好走过了10年。微软在展会上首次展示了Windows RT操作系统(实则为NT内核对Arm的支持)——这是个彻头彻尾基于32位Arm架构的PC操作系统,代号Windows on Arm(WoA)。次年10月,Windows RT与Windows 8一同发布。从这个时候开始,微软似乎就一直在动“脚踩两只船”的歪脑筋。
Windows RT的“RT”两个字母有部分指代runtime的意思。微软的理想是在搭建的Windows RunTime运行时之上,同时实现对x86和Arm的支持(上图中的Metro style Apps)。Windows 8及当时的Windows Phone 8也有这么个runtime;这是微软最早期望实现不同平台生态统一化的设想。不过最早的Windows RT作为操作系统,仅支持Arm应用。而且微软仿照iOS和Android生态,令Windows RT用户仅可从应用商店下载app,以实现对应用生态的全面掌控。
微软还专门推出了搭载Windows RT系统的Surface设备,延续了两代。当年的Surface初代采用基于Arm架构的英伟达Tegra 3处理器,算是真正意义上Arm入驻PC生态的开端。不过微软对Arm生态的三心二意,以及应用商店几乎没有像样的应用,传统的x86应用又完全不支持,让Windows RT很快宣告了终结。微软还因此遭受了9亿美元的亏损。(Windows RT的终结,另一方面与当时Intel开始和微软大力推9英寸以下Windows山寨设备有关)
2012年的Tegra 3属于英伟达在移动处理器领域的早期作品,这颗SoC以Cortex A9 4+1的设计,在当时也算个异类了。彼时的Arm处理器应用到Windows PC设备算是新鲜事,只不过那个时期的Arm架构处理器在性能上,与x86仍不在一个维度。
Windows RT虽然终结,但其中的runtime为如今Windows 10 on Arm奠定了重要的基础,这是后话了。事实上在此期间,微软还有过一些同类尝试,比如说2017年发布的Windows 10S。Windows 10S虽然并不定位在基于Arm,但严格限定了仅可从微软商店下载app。按照微软的说法,这个系统是为教育市场开发的,主要用于狙击Chrome OS上网本。但次年10S就被放弃。
这些尝试无一不表明,微软对iOS、Android一类生态的眼馋从未停止过。好好的,微软究竟为何要从深耕多年的x86生态“红杏出墙”,大肆向Arm表达“爱意”?我想其中至少有几个原因:
其一,Windows原有生态相对混乱。包括系统安全性差,冷不防就被人植入木马;且Windows应用于入门级硬件的体验很差,一水的Atom上网本实在不怎么样,这与Windows臃肿的生态是分不开的。微软因此期望牢牢掌控应用生态,这是Windows RT、Windows 10S出现的原因。
其二,转向Arm理论上可以让OEM厂商获得更高利润空间,戴尔、联想这些企业会有更强的意愿做推广。而且新生态下,廉价设备不需要绑一大堆垃圾软件出售,用户体验可获提升。
其三,在疫情出现以前,PC行业已长期停滞不前,PC出货量连年下降;行业需要技术上的强心针来推一把。
PC出货量下滑又是个庞大的话题了,与本文相关的原因至少包括PC平台本身缺乏创新,Intel/AMD此前十多年的竞争实在是有些不思进取。智能手机、平板的出现也事实上拉低了很多人对PC的依赖,像iPad Pro这样的设备变得既能轻度办公,续航、流畅度、性价比各方面都优于PC。
可能还有一个重要原因,在微软前CEO鲍尔默卸任后,新任CEO纳德拉很快就调整了微软的策略,微软的每个产品线独立发展。所以2014年Office就全面支持iOS,随后微软就成了苹果最佳开发者,M1芯片MacBook发布会上,苹果称微软是“我们的朋友”……微软作为生产力工具界的扛把子,纳德拉的策略也实实在在影响到了PC的销量。
上面这张图是国外Wikibon去年上半年预测的PC出货量变化。当然这个预测实则并未考虑到疫情对PC行业的刺激作用(以及缺芯的影响)。但在大方向上,Arm能够极大推升PC出货量的上扬是共识。
这就相关第四点了,即Arm与生俱来的低功耗属性,令其格外适用于笔记本这样的移动PC设备。基于Arm芯片的笔记本设备,续航是真正的一整天,与x86笔记本续航不可同日而语。加上微软系统层面的努力,以及PC设备形态可能发生变化(如折叠屏笔记本),PC体验能够再上一个台阶。Arm芯片的发展,尤其性能上的跨越式进步、生态的逐步完善,在此又是一个重要话题。
走了10多年,才开始走近PC主流视野
事实上,Arm阵营这边在这10多年间也从未放弃过登陆PC平台。除了前文提到的Arm与微软积极合作,还包括高通这样的芯片设计商期望实现Android系统的PC化努力(罗永浩的Smartisan TNT就得到了高通的大力支持)。只不过起码这10年间,Arm针对PC平台的攻势,都从未真正成功过。
这也是多方面原因导致的。第一自然就是x86生态根深蒂固,难以在短期内撼动;第二,Arm在苹果M1(和骁龙8cx)之前,也的确没有真正拿得出手、能在性能上与x86相较的PC处理器;第三,微软在两个生态间摇摆不定,想要拥抱Arm的同时,又舍不得昔日x86,这也成为Arm真正搭上PC这艘船的重要阻碍。
今年MWC上海展会上,高通展示的骁龙8cx笔记本,不仅是微软自己的Surface Pro X,还包括三星、联想等OEM厂商的多款设备
即便是现在,其中第三个原因都仍然存在。不过随着微软再再再次与Arm合作,新版Windows 10 on Arm的成熟度,以及如今的Arm芯片,已经和当年大不一样了。前两个问题正被逐渐解决。微软这边,当年的Windows RT就积累了不少经验。
Surface Pro X设备就是Windows 10 on Arm最佳实践。这台设备采用高通8cx处理器,单系统本身及微软官方应用(如Office、Edge)使用体验都很好,续航表现远超x86版本的Surface,且设备不带风扇,还更轻薄。只不过由于生态问题,Surface Pro X运行x86应用时,x86->Arm转译成本高,效率非常悲惨。
微软SQ1,即骁龙8cx
Windows 10 on Arm的大方向思路未变,即在Windows Runtime之上,要同时跑x86和Arm应用。在所有Arm、x86平台的Windows设备上,提供通用API。这是很理想的一种开发设定,微软称其为UWP(Universal Windows Platform),不需要管下层处理器架构。而UWP应用又会全数上架至官方应用商店。不过即使到目前为止,微软UWP的开发响应者都仍然不多。
所以针对传统x86应用,微软也开发了x86->Arm的模拟器,让以前的很多x86软件也能跑在Arm版Windows 10之上。要说微软的动作还真是相当缓慢,不谈32位应用的WOW64模拟器效率很低——Adobe全家桶这样的软件跑起来几乎就是灾难;而且64位应用模拟器迟迟未进入正式版,现在还在Windows预览版通道中(据说效果不错)。
不过Windows 10 on Arm早就比当年的Windows RT有了高得多的可用性。而且至少这次,生态构建效率稍高了一些,比如Adobe去年12月面向Windows平台发布了Arm版的Lightroom,Arm版Photoshop也处在beta状态了——总算开发者响应比以往更积极。更不用提,Arm版macOS一推出,主要开发者几乎是群起响应。
Arm这边,面向Windows笔记本的高通骁龙8cx如今走到了第二代,也是与微软合作的第二代产品。其低功耗表现实则无需赘言,SuraceProX的超长续航即是佐证。关键应在于,这颗芯片在性能上和x86阵营的竞品比起来如何。如我们此前在M1芯片分析文章中谈到的那样,骁龙8cx的实际性能顶多是差强人意。
来源:NotebookCheck
不过毕竟骁龙8cx功耗水平才7W——这个功耗顶多也就是手机芯片的加强。以3.15GHz(Cortex-A76)的频率,达成与Intel LakeField(酷睿i5-L16G7)相似的单核性能成绩也在情理之中。值得一提的是,虽说Geekbench算不上什么靠谱的跑分工具,但看NotebookCheck的这些得分,Arm阵营这两年的整体水平实则都不再是10年前的孱弱样子了。
基于Arm指令集的苹果M1芯片的带来,则全面证实要用Arm来实现高性能,应用于PC是完全可行的,与此同时还能达成碾压x86阵营的低功耗水平。
PC之外的“高性能”扩展
总结一下Arm之所以在10年以后才真正有能力在PC之上逐渐站稳,一方面在于微软和苹果作为操作系统供应商态度的转变;另一方面也是Arm在经过这么多年的发展后,在低功耗的基础上,还有与x86阵营在性能方面一战的能力——Arm、苹果、高通在其发展中都做出了不可磨灭的贡献。
事实上,微软如今对待Arm和x86两者的态度依然是暧昧的,Windows Runtime运行时的存在已说明一二。这始终是横亘在Arm面前的一座大山。不过微软正在规划新的Windows 10X系统,预计今年会随同部分便携式硬件推向市场。
Windows 10X是个试图抛弃历史遗留问题,加强用户体验和安全性的系统。系统不再原生支持传统的win32应用,而是将这些传统应用默认放到container中运行。当然它也支持Windows Runtime API。且似乎现有规划中的Windows 10X设备都基于Arm平台,这对Intel实在不是什么好消息。
当然以微软态度摇摆的传统,Windows 10X仍有可能是下一个Windows RT或者Windows 10S。但从中,我们还是能看到微软起码在试探重整Windows生态的可行方案,Arm则会是这个方案的基石。
与此同时,苹果以极其潇洒的姿态抛弃x86生态,开发生态全面转向自家的Arm芯片,实则也在无形中帮助微软加速了转舵过程。
最后可以谈一谈PC之外,Arm如今的扩张。IoT和更多低功耗芯片市场就不谈了,毕竟这一直都是Arm主场,比如说小至SSD固态硬盘主控芯片的Cortex-R系列实时核心,大到虽被唱衰但发展依然不错的Cortex-M系列面向IoT设备的低功耗芯片。
Arm对高性能计算市场的冲击也不是第一次了,只是此前尝试都不能算成功。和Arm在PC市场的发展一样,这两年Arm芯片在HPC、超算、数据中心市场的发展又构成了新局面。这其中有一些典型事迹:
比如说去年富士通发布名为富岳的超算,成为新的全球超算第一,其中的A64FX芯片就基于Arm v8.2A架构,这颗芯片的市场反响就相当好,规划中今年出货给亚马逊、谷歌、微软这些云供应商。再比如前年亚马逊宣布其自研Graviton2处理器应用于AWS EC2,就是采用Arm Neoverse N1架构。
去年9月,Arm又为Neoverse家族(面向基础设施)新增了V系列,比此前的N和E系列都更偏重性能,就像数据中心界的Cortex-X1,通过进一步打破PPA限制,在单核性能上对标x86高性能核心。
与此同时,如此前在《Arm在数据中心的价值:黄氏定律背后,英伟达打的什么算盘?》一文中所述。英伟达在数据中心的强势,预计未来会令主控CPU愈加边缘化。而英伟达对Arm的收购,则将Arm推向了进一步的大一统。在端到端部署Arm之际,也就是Intel退场的时候了。
不过Arm的这种发展策略因大环境与英伟达对其收购,亦存在不少变数。我们此前采访的不少企业就预想到了因收购可能产生的商业风险,不止一家企业都强调采用Arm与RISC-V并行的策略,且提及RISC-V在多个方向上的发展愈发成熟;一些重要的市场玩家都在筹备后手。但有挑战存在的市场,才有发展。即便是不思进取的x86平台,这两年都焕发了新活力。
更多有关IC设计的精彩内容,欢迎参与即将在3月18日于上海召开的2021中国IC领袖峰会,与专家面对面。点击峰会主页链接,报名参与此次盛会。
责编:Luffy Liu