处理器:回顾计算机架构、商业大型机与超级电脑的诞生

智能计算芯世界 2022-09-17 00:00


俗语说的好,有人的地方就有「江湖」和「政治」。同理可证,有产品的公司就有「腰斩」、「中止」和「任其自生自灭」,处理器业界亦不可免俗,计算机工业的历史洪流充满无数无缘与世人见面的梦幻逸品,与渐渐被后人遗忘却开辟崭新时代的旷世巨作。

不学无术的笔者,再次野人献曝,简述知名的梦幻处理器,这深入迷雾的探险过程,不仅让各位一窥庐山真面目,更是一段横跨超过半个多世纪光阴的宏大叙事曲与记录计算机工业演进的显微胶卷片。

1960 年代:计算机结构、商业大型主机与超级电脑的诞生

要挑选出一家最能代表计算机工业的商业公司,只要对历史脉络不会太不熟,多半还是会想到那大大的「三个大写英文字母」。不过这家公司也并非在所有领域「叫我第一名」,更多是「后发先至」,因一度领先的竞争者都纷纷成为历史遗迹,所谓「英雄就是比气长」大概就是这回事。

第二代(晶体管)与第三代(集成电路)电脑交错期的1960 年代,可谓计算机工业的曙光期,奠定今日我们对「电脑」的基础认知,包含提升执行效率的指令流水线处理(IBM 7030 ″Stretch″)、让更换电脑也不必替换软件的指令集回溯兼容性(IBM System/360 家族)、高可靠性的商业导向大型主机(IBM System/360 家族)、以浮点运算为主的高性能运算超级电脑(CDC6600)、处理器必备武装Cache 存储器(IBM System/360 Model 85)与构成今日高性能处理器微架构的动态指令排程与乱序指令执行(IBM System/360 Model 91),都是这时期的产物,距今超过60 年。

▲ 漫长的计算机工业历史,第三代电脑(集成电路)先驱的IBM System/360 可谓最重要的主角,没有之一,奠定今日对电脑的基本认知,相同指令集架构的电脑可彼此软件兼容、微码(Microcode)控制单元、软盘机(存放微码)、虚拟化、Cache 存储器、「1Byte(位元组)=8Bits(位元)」的工业标准、虚拟存储、乱序指令执行,堪称近代电脑技术发展的缩影。

「兼容性」并非理所当然的天赋人权

不过开始过目「受害者清单」前,得先稍微了解当时市场竞争态势与产品技术概况。

1961 年IBM 可谓统治电脑市场,北美拥有超过三分之二市占率。当年问世的IBM 7030 ″Stretch″,是史上第一台通用的指令流水线化(Pipeline)电脑与IBM 首款「晶体管化(第二代电脑)超级电脑」,利用四级流水线,互相重叠指令撷取、解码和执行得到1.6 倍效能,目标比前代IBM 704 快100 倍,也是昵称「Stretch」(延伸)的由来。

▲ 由Gene Amdahl 操刀的IBM 7030 Stretch″(1961 年)是计算机工业史第一台导入指令流水线的电脑。

在那个时代,不同电脑都有自己的独特指令集、专用操作系统与外围设备,意味购入或升级新电脑,就需要整个「砍掉重练」,连程序都要重新编写,极度不便,也严重妨碍电脑普及。

有鉴于此,一年营收25 亿美元(约今日230 亿美元)的IBM,1961 年12 月启动人类史上规模最大的商用产品开发计划(号称仅次登月计划和航天飞机),耗资50 亿美元(约今日的460 亿美元)、雇用6 万多名新员工、新建5 座工厂,历经4 年,1964 年4月7 日推出六种规格的System/360商用大型主机(Mainframe)和超过40 种扩充外围,开启第三代(集成电路)电脑序幕,价格从最低13 万美元一路延伸到最顶规550 万美元,客户可照需要选购不同机种和配件,或更省力全部用「租」的(这是大型主机常见的商用业模式)。

▲ 直到IBM System/360 1964 年出现后,世人才知道「原来升级电脑后,我还可以继续用现有应用软件与外围硬件」,这对电脑普及是最重要的一步。

最终到1971 年,包含NASA(美国太空总署)特化机型(曾在登月计划扮演重要角色),总计出现14 个System/360 型号,统一执行相同OS/360 操作系统,共用一致系统外围设备,彻底改变人类对电脑的理解,「兼容性」从此成为计算机工业的「基本价值观」,催生「计算机架构」(Computer Architecture)这象征「指令集向前兼容」的历史性名词,也让开发软件和研发外围,成为具高度获利价值的产业。对客户来说,可视眼前需求选购合用机型,日后升级亦可沿用现有软件与外围,这也是今日司空见惯的常识,但在那遥远的年代,却不是理所当然的「天赋人权」。

值得注意的是,即使System/360 奠基于微码(Microcode)之上的CISC(复杂指令集电脑),但相较后进「同侪」,如DEC VAX 和英特尔x86 / iAPX432,指令编码格式和与定址模式(Addressing Mode)的对应关系,还是较简洁有条理,也让人不得不纳闷这票「后辈」到底在想什么,尤其是英特尔。就笔者印象所及,CISC 指令集唯一能与System/360 媲美者,好像也就只有Motorola 68000 了。

▲ 相对「毫无道理可循」的英特尔80x86(指令长度介于1~17Bytes)、乱成一团的DEC VAX(指令长度介于1~54Bytes)和史上最恐怖的英特尔iAPX432(指令长度介于6~321″Bits″,你绝对没看错),更古老的IBM System / 360 指令编码格式却异常简洁优美,也一路发展到现在64 位元System z 大型主机。

开创计算机结构的System/360,发表后第一个月就卖出超过一千台,之后半个世纪,以System/360 为首的IBM 大型主机产品线,贡献蓝色巨人超过一半利润。最新成员System z 更位居服务器世界顶峰,成为无数金融业核心帐务不可或缺的最可靠心脏。

System/360 主架构师Gene Amdahl(也曾负责IBM 7030)以「Amdahl′s Law」(针对电脑系统某特定元件最佳化,观察能改变多少整体系统效能)闻名于世。当时专案经理Frederick Brooks 事后根据System/360 软件开发经验,写成《人月神话:软件专案管理之道》(The Mythical Man-Month: Essays on Software Engineering),记述人类工程史上里程碑式大型复杂软件系统。美国企管学家Jim Collins 在《从A 到A+》(Good to Great)将IBM System/360 与福特T 型车、波音第一款喷气机波音707 齐名,列为史上最重要的三项企业成就。

源自二战美国海军密码破解团队的CDC 与定义「成功的超级电脑」的CDC6600

称之为「人类历史上最伟大电脑」大概不会有太多人敢反对的System/360,既然如此成功,为何会冒出被腰斩的全新产品?就只因一家1957 年草创时只有30 几个人的小公司CDC(Control Data Corporation)。但这些人来头可不小,神秘且显赫,都是来自二次世界大战期间,美国海军破解德国和日本密码的极机密工程团队,成员含首席架构师、大名鼎鼎的超级电脑大师Seymour Cray。

和System/360同年的9 月,有每秒300 万次浮点运算、足足是IBM 7030 三倍的CDC6600,1969年前都占据最快电脑宝座,销售总数超过100 台,定义了日后人类对「高性能运算」(HPC,High Performance Computing)和「超级电脑」(Super Computer)的观感。少少34 名员工(只有14 名工程师和4 名程序设计师,剩下就是行政打杂看门之类)就能打造出这么高性能的产品,对IBM 高层更是极大的刺激。

▲ 由超级电脑大师Seymour Cray 主导设计的CDC6600(1964 年),可谓世界第一台「成功的超级电脑」,也让HPC 从此与高性能浮点运算划上等号。

CDC6600 之所以如此夸张,不外乎大量采用「超越时代」手段:近似超标量(Superscalar)的多派发指令执行单元,貌似乱序指令执行(Out-Of-Order Execution,OOOE)的记分板(Scoreboard)动态指令排程,神似多线程(Multithreading)的共用外围处理器(Peripheral Processor),RISC(精简指令集电脑)存储器载入/回存(Load / Store)架构、仅有两种运算元定址模式与区区74 个指令,以上种种都使CDC6600 成为RISC 与众多先进处理器高性能技术的起源。

假如要笔者用最短文字描述「大型主机」(Mainframe)和「超级电脑」的差异,唯一可想到的是「前者必须永不停机跑COBOL,后者则要吃奶加速冲FORTRAN」。相信内行人马上就了解笔者想表达的意思。

▲ 透过多达10个指令执行单元、「多线程共享」的外挂辅助处理器(Peripheral Processor)以及在指令执行的过程中可追踪指令间相依性的记分板(Scoreboard)以变相达成某种程度的乱序指令执行,CDC6600 实现前所未见的超高性能,并重打击IBM 高层的信心。

前面提到IBM System/360 以「兼容性」著称,那CDC6600 后面又如何?后继机型CDC7600(原CDC6800)为了避免「牺牲性能」,就仅维持「高级程序语言原代码的可携性」(意思就是重新编译代码),且连操作系统也不同。以今日观点看,为追求性能放弃兼容性看似舍本逐末,但在那个时代却习以为常。

功败垂成的IBM ACS

IBM 原先1961 年启动实验性专案「Project-Y」,目标达IBM 7030 百倍效能,1965 年转为加州ACS-1(Advanced Computer Systems-1)计划,动员超过200 名工程师。但IBM 在1968 年5 月却要求ACS 须兼容System/360,并改名为ACS-360。很明显的,要「兼容CISC 的System/360」并「性能超越『类』RISC 的CDC6600」完全相互矛盾。因此挣扎了一年,IBM 还是在1969 年5 月黯然中止ACS-360,也失去大量研发人员。

但塞翁失马焉知非福,IBM ACS 并非一无所获,不但得到比CDC6600 更多「前RISC」相关技术与诸多创新,更在编译器领域有突破,特别是IBM 首位女性院士、也是第一位得到计算机工业最高荣誉「图灵奖」(Turing Award)的女性Frances Allen,就是ACS 团队的一员,并在IBM 任职长达45 年之久。

划时代的电脑:IBM System/360 Model 91

但这笔者不得不提及划时代的电脑:IBM System/360 Model 91。

▲ 近代高性能处理器微架构必备的乱序指令执行,核心技术「暂存器重新命名」(Register Renaming)背后的灵魂「Tomasulo 演算法」,就是由IBM System/360 Model 91 为起点。上图摄于美国太空总署戈达德太空飞行中心(NASA Goddard Space Flight Center)。

原名Model 92 的Model 91,原先寄望性能可抗衡CDC6600,并有System/360 的指令兼容性。System/360 引入很多崭新观念,包含暂存器重新命名(Register Renaming)的Tomasulo 演算法、动态侦测存储器危障(Memory Hazard)、广义的运算元前馈(Operand Forwarding)机制,讲白话点就是「各位今天眼前看到所有乱序执行就是这样诞生的」,System/360 Model 91 更是第一台使用多通道存储器(Multi-Channel Memory)技术的电脑。

开创大量先进技术的System/360 Model 91,也成为当时最强的整数运算王者,每秒最多可执行1,660万个指令(16.6MIPS),假若不管指令集架构的差异和每个指令的平均工作量,这相当于「1991 年」时钟频率20MHz 的英特尔80486SX 或40MHz 的AMD 80386DX。

不幸的是,设计高复杂度使其较晚上市,且只卖了少少几台(生产总数,据信不超过20 台),市场并不成功,导致第一台有Cache 存储器的Model 85 还卖比较好。至于乡野流传IBM 发挥「简报王」本色,藉由耳语相传不存在的System/360 Model 92「暗示」潜在客户不要急着买CDC6600,乖乖等IBM 新产品的稗官野史,就不在本文讨论范围了。

无论System/360或CDC6600,关键技术和诸多想法都逐渐消失的25 年后,1990 年代再度复活──但仅限西方世界,下一篇文章的结尾会提及冷战时期的苏联

行文至此,是否各位有股「啊,原来一切的一切,早在半个多世纪前就结束了」之慨?

来源:technews(台)  作者:痴汉水球
下载链接:
基于GPU统一内存优化的图计算框架设计
GPU技术专题下载链接
《GPU高性能计算概述》 
《GPU深度学习基础介绍》 
《OpenACC基本介绍》 
《CUDA CC 编程介绍》 
《CUDA Fortr基本介绍》
深度报告:GPU研究框架
半导体材料系列报告(上): 国产替代正当时,把握扩产窗口期
半导体材料系列报告(下):Chiplet引领封测行业新机遇
图解数据中心基础设施:PCIe总线和NVMe SSD测试
PCIe Gen 4&5总线协议分析和SSD测试工具白皮书
异构芯片研究框架合集
《国产操作系统专题(3)》
《国产操作系统专题(2)》
《国产操作系统专题(1)》
《信创专题合集》
1、信创专题(二).pdf
2、信创专题(一).pdf
操作系统产业完全解析
机器人操作系统的实践与思考
中兴新支点桌面操作系统用户手册


本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料。



免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。



电子书<服务器基础知识全解(终极版)>更新完毕。

获取方式:点击“阅读原文”即可查看182页 PPT可编辑版本和PDF阅读版本详情。


温馨提示:

请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。

智能计算芯世界 聚焦人工智能、芯片设计、异构计算、高性能计算等领域专业知识分享.
评论
  • ​本文介绍PC电脑端运行VMware环境下,同时烧录固件检测不到设备的解决方法。触觉智能Purple Pi OH鸿蒙开发板演示,搭载了瑞芯微RK3566芯片,类树莓派设计,Laval官方社区主荐,已适配全新OpenHarmony5.0 Release系统!PC端烧录固件时提示没有发现设备按照各型号烧录手册中进入loader模式的操作方法,让开发板连接到PC端。正常来说开发板烧录时会显示“发现一个LOADER设备”,异常情况下,会提示“没有发现设备”,如下图所示: 解决步骤当在烧录系统固
    Industio_触觉智能 2024-12-18 18:07 57浏览
  • 由于该文反应热烈,受到了众多工程师的关注,衷心感谢广大优秀工程师同仁的建言献策。特针对该技术点更新一版相关内容! 再次感谢大家的宝贵建议!填充铜(Solid Copper)和网格铜(Hatched Copper)是PCB设计中两种不同的铺铜方式,它们在电气性能、热管理、加工工艺和成本方面存在一些区别:1. 电气性能:填充铜:提供连续的导电层,具有极低的电阻和最小的电压降。适合大电流应用,并能提供优秀的电磁屏蔽效果,显著提高电磁兼容性。网格铜:由于铜线之间存在间隔,电阻相对较高,电压降也
    为昕科技 2024-12-18 17:11 74浏览
  • 习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-18 14:02 100浏览
  • 车载光纤通信随着ADAS(高阶驾驶辅助系统)、汽车智能网联、V2X和信息娱乐技术的不断发展,车载电子系统和应用数量迅速增加。不断增长的车内传输数据量对车载通信网络造成了巨大的数据带宽和安全性需求,传统的车载总线技术已经不能满足当今高速传输的要求。铜缆的广泛使用导致了严重的电磁干扰(EMI),同时也存在CAN、LIN、FlexRay等传统总线技术不太容易解决的问题。在此背景下,车载光纤通信技术逐渐受到关注和重视,除了大大提高数据传输率外,还具有抗电磁干扰、减少电缆空间和车辆质量等优点,在未来具有很
    广电计量 2024-12-18 13:31 110浏览
  • 户外照明的“璀璨王者”,艾迈斯欧司朗OSCONIQ® C3030降临啦全球领先的光学解决方案供应商艾迈斯欧司朗(瑞士证券交易所股票代码:AMS)近日宣布,推出新一代高性能LED——OSCONIQ® C 3030。这款尖端LED系列专为严苛的户外及体育场照明环境而设计,兼具出色的发光强度与卓越的散热效能。其支持高达3A的驱动电流及最大9W的功率输出,以紧凑扁平封装呈现卓越亮度和可靠性,确保高强度照明持久耐用且性能出众。应用领域01体育场及高杆照明OSCONIQ® C 3030以卓越的光通量密度、出
    艾迈斯欧司朗 2024-12-18 14:25 102浏览
  • 以人形机器人和通用人工智能为代表的新技术、新产品、新业态蓬勃发展,正成为全球科技创新的制高点与未来产业的新赛道。01、Optimus-Gen 2来了,人形机器人管家还远吗?没有一点点防备,特斯拉人形机器人Optimus-Gen 2来了!12月13日,马斯克于社交媒体上公布了特斯拉第二代人形机器人的产品演示,并预计将于本月内发布。在视频中,Optimus-Gen 2相比上一代有了大幅改进,不仅拥有AI大模型的加持,并在没有其他性能影响的前提下(相比上一代)将体重减少10kg,更包含:由特斯拉设计的
    艾迈斯欧司朗 2024-12-18 12:50 117浏览
  • By Toradex秦海1). 简介为了保证基于 IEEE 802.3 协议设计的以太网设备接口可以互相兼容互联互通,需要进行 Ethernet Compliance 一致性测试,相关的技术原理说明请参考如下文章,本文就不赘述,主要展示基于 NXP i.MX8M Mini ARM 处理器平台进行 1000M/100M/10M 以太网端口进行一致性测试的测试流程。https://www.toradex.com
    hai.qin_651820742 2024-12-19 15:20 43浏览
  • 在强调可移植性(portable)的年代,人称「二合一笔电」的平板笔电便成为许多消费者趋之若鹜的3C产品。说到平板笔电,不论是其双向连接设计,面板与键盘底座可分离的独特功能,再加上兼具笔电模式、平板模式、翻转模式及帐篷模式等多种使用方式,让使用者在不同的使用情境下都能随意调整,轻巧灵活的便利性也为多数消费者提供了绝佳的使用体验。然而也正是这样的独特设计,潜藏着传统笔电供货商在产品设计上容易忽视的潜在风险。平板笔电Surface Pro 7+ 的各种使用模式。图片出处:Microsoft Comm
    百佳泰测试实验室 2024-12-19 17:40 78浏览
  •  2024年下半年,接二连三的“Duang Duang”声,从自动驾驶行业中传来:文远知行、黑芝麻、地平线、小马智行等相继登陆二级市场,希迪智驾、Momenta、佑驾等若干家企业在排队冲刺IPO中。算法模型的历史性迭代与政策的不断加码,让自动驾驶的前景越来越清晰。由来只有新人笑,有谁听到旧人哭。在资本密集兑现的自动驾驶小元年里,很多人可能都已经遗忘,“全球自动驾驶第一股”的名号,曾经属于一家叫做图森未来的公司。曾经风光无两的“图森”,历经内讧与退市等不堪往事之后,而今的“未来”似乎被锚
    锦缎研究院 2024-12-18 11:13 92浏览
  • 沉寂已久的无人出租车赛道,在2024年突然升温了。前脚百度旗下萝卜快跑,宣布无人驾驶单量突破800万单;后脚特斯拉就于北京时间10月11日上午,召开了以“We,Robot”为主题的发布会,公布了无人驾驶车型Cybercab和Robovan,就连低调了好几个月的滴滴也在悄悄扩编,大手笔加码Robotaxi。不止是滴滴、百度、特斯拉,作为Robotaxi的重磅选手,文远知行与小马智行,也分别在10月份先后启动美股IPO,极氪也在近日宣布,其与Waymo合作开发的无人驾驶出行汽车将大规模量产交付,无人
    刘旷 2024-12-19 11:39 97浏览
  • You are correct that the length of the via affects its inductance. Not only the length of the via, but also the shape and proximity of the return-current path determines the inductance.   For example, let's work with a four-layer board h
    tao180539_524066311 2024-12-18 15:56 105浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦