苹果M1 Pro/Max处理器性能“震撼”的秘密是什么?

原创 面包板社区 2021-10-22 17:20


北京时间2021年10月19日凌晨,苹果发布了M1 Pro和 M1 Max处理器,其超强的性能足以“震撼”整个PC界。“虽然”其CPU性能比M1提升仅70%,GPU的速度提升最高达到4倍,NPU的速度提升3倍。但这些都不足以说明M1 Pro/Max的“震撼”,因为其目前的性能都是苹果自己所说而不是实测,而且,苹果每发布新一代处理器,官宣其性能都是动辄比上代提升40%以上。那真正让PC界震撼的是什么呢?苹果的每一代新处理器性能强劲的秘密是什么?

我们来看看M1 Pro和M1 Max的系统架构图:

广告

在架构图上看到的最大的数字是33.7 billion和57 billion!

没错真正让PC“震撼”的其实是晶体管数量:M1 Pro的晶体管数量达到337亿,M1 Max更是达到恐怖的570亿。

谁是晶体管数量最多的芯片?

 

Graphcore 第2代 IPU GC200:594亿

在此之前,晶体管数量最多的处理器是英国AI公司Graphcore于2020年7月发布的第2代IPU GC200,采用7nm工艺制程,晶体管数量达到594亿,是10月19日前,无论是手机、PC界还是服务器界,迄今为止晶体管数量最多的单处理器。这是目前AI处理能力最强的处理器之一。其价格是三万美元起。

2019年,Graphcore公司CEO Nigel Toon参加了第二届“全球CEO峰会”(2021年11月3日举办第四届)。他曾表示:“将来他们可能会在英国构建第一个能够和苹果或者阿里巴巴媲美的大规模企业。”

Graphcore公开了基于GC200处理器的IPU-M2000的应用性能。Benchmark显示,相比NVIDIA的A100,在IPU-M2000上,ResNet的吞吐量提升了4倍,ResNeXt的吞吐量提升了5.4倍,EfficientNet的吞吐量达到了18倍,Deep Voice 3达到了13倍。

2021年10月22日,Graphcore发布了迄今为止最大型的最新产品IPU-POD128和IPU-POD256,分别能够提供32 petaFLOPS和64 petaFLOPS的AI计算。

关于GC200的性能详见:https://www.eet-china.com/news/10521.html

阿里巴巴平头哥“倚天710”:600亿

当然,阿里巴巴平头哥在10月19日举行的2021云栖大会上,发布了基于Arm架构的自研云芯片“倚天710”,采用5nm工艺,单芯片可容纳高达600亿颗晶体管。这应该是目前晶体管数量最多的单处理器了。其处理能力也非常强劲,当然,“这款芯片不出售,主要是阿里云自用。” 阿里云智能总裁、达摩院院长张建锋表示。其造价估计远超Graphcore的第2代IPU GC200。

晶体管数量=处理器性能?

根据摩尔定律:集成电路上可容纳的晶体管数量,约每隔两年便会增加一倍,同时处理器的性能也会成倍增长。

尽管最近几年,IC芯片界,特别是Inel CPU的挤牙膏式升级,让大家认为摩尔定律似乎也停滞了。不过,总体来说,目前为止摩尔定律一直都是有效的。

在处理器内部,晶体管数量正比于逻辑门数量,也正比于电路复杂度。如果新一代处理器单位面积晶体管数量翻番,那么这一代处理器的核心数量就可以加倍,性能也会相应提高,其制造成本也会降低。

在目前通用的串行处理器架构下,业界基本认为处理器性能与晶体管数量成正比。

但是,也并不完全认同。

CPU性能并非仅与晶体管数量有关,还与主频、制程、架构、流水线长度等有关系。

一个最经典的例子就是intel 奔腾4 , P4时代的时候英特尔一味追求主频,导致流水线过长并且功耗巨大。被当时的K8按在地上摩擦。

在同一时代,同一制程下,也晶体管数量也并非越多越好。拿AMD的Ryzen 7 1800X和Intel 的i7 6900K,两个性能不相上下的CPU来进行对比:1800X和6900K的性能不相上下,而且二者都是14nm制程。

Ryzen 7 全系都是192mm2,48亿晶体管。而i7-6900K为246mm2,34亿晶体管。这是因为AMD在FinFET技术上还是比较落后,这也证明晶体管数量不能决定一切。

从上面的对比来看,处理器性能的确与晶体管数量有关,但似乎单位面积的晶体管数量并不是影响CPU性能关键。晶体管数量也并非越多越好。处理器性能与晶体管数量、频率、高速总线,以及现在的GPU和NPU都有关系。 

苹果M1 Pro/M1 Max 及A系列处理器性能分析

笔者Challey统计了苹果自开始公布晶体管数量以来的主要处理器的性能及参数,见下图:

苹果系列处理器性能分析-Full

性能参数详图

苹果处理器各信息详图

其中,M1 Pro/Max 提升的对比对象均为M1。

当然,在A系列处理器,苹果还发布了A12X等AnX处理器,有时候性能比An+1X还强,那些处理器主要是配备在iPad系列上。

苹果在发布新一代处理器时,一般会官宣其CPU、GPU、NPU(A11开始)的性能会比上一代提升多少,偶尔还会与业界同行处理器进行比较,其性能提升一般都是30-40%以上。

笔者Challey用特定算法针对CPU、GPU、NPU的性能提升进行了处理,得出了一个有关处理器的整体综合性能提升情况分析(见上表中的“比上代综合性能提升”一列)。从这里发现处理器综合性能的提升确实与晶体管数量的增长比率成正比。

结语

2013年的Haswell是Intel最后一次透露晶体管数目的CPU,其4核的型号是14亿。与Intel恰恰相反,自A7开始,苹果每发布新一代,都要“大张旗鼓”的宣布其晶体管数量增加了多少,其性能提升了多少,虽然有其营销的成分在里面,但综合分析来看,没错,苹果处理器性能强劲的“密码”就在于晶体管数量的不断增加。

当然,其不断升级的制程和缩小的面积,还有功耗的降低也是苹果处理器性能强劲的原因,同样还离不开各种协处理器、GPU、NPU、不断提升速度的统一内存(M1 Pro 200GB/s, M1 Max 400GB/s)、以及整体架构的优化,更重要的是还有其自家的iOS或者macOS系统优化。

苹果M1 Pro 和 M1 Max处理器的推出,对整个桌面端处理器市场将带来长远的影响,对Intel和AMD也会带来不小的冲击。

基于M1 Pro/Max非常可期的市场预期,三星、英特尔、台积电已经展开对苹果处理器代工的激烈争夺战。

而更重要的是,M1 Max的晶体管数量级已经达到了Graphcore2代IPU GC200阿里平头哥倚天710服务器处理器500-600亿的水平。

因此,苹果M1 Pro/Max之后,其不断提高晶体管数量进而提升性能的新处理器,对服务器市场的冲击也将逐渐出现,未来,不同于针对普通边缘计算的嵌入式小处理器的大边缘计算处理器市场也将会很快出现。

关注『面包板社区』,后台回复"技术关键词"领取300 G学习资料包如:电源、电机、嵌入式、信号系统、模电、华为、电子学、电路、c语言...)


扫码关注@面包板社区
每天学点电子技术



#推荐阅读#
  • “解剖”电子元器件:看看里面都有啥?

  • PCB Layout的设计要点

  • 一个低成本电容毁了我的显示器!

  • 一个清晰的LCD驱动编写思路(附代码分析)

  • STM32如何高效接收串口数据?

  • MOS管驱动电路设计,如何让MOS管快速开启和关闭?

  • 电感四条腿?没错,来了解一下!

  • “人类高质量电路板”都是怎么做出来的?

  • 经典:视频讲解 I²C

  • 相位补偿到底是什么鬼?

  • 怎么样的PCB才能承受住100 A的电流?

  • 陀螺仪工作原理【视频】


点击阅读原文,下载《芯片制造 半导体工艺制程实用教程》

面包板社区 面包板社区——中国第一电子人社交平台 面包板社区是Aspencore旗下媒体,整合了电子工程专辑、电子技术设计、国际电子商情丰富资源。社区包括论坛、博客、问答,拥有超过250万注册用户,加入面包板社区,从菜鸟变大神,打造您的电子人脉社交圈!
评论 (0)
  • 一、引言:语音芯片的智能化浪潮在万物互联的智能化时代,语音交互技术已成为人机交互的重要纽带。从智能家电的提示音到儿童玩具的趣味互动,从工业设备的语音告警到公共服务设施的自动播报,语音播放芯片IC作为核心硬件支撑,正在重塑各行各业的用户体验。在众多解决方案中,WTN6、WT588、WT2003H、WTV四大系列产品,凭借差异化的技术特性构建了完整的语音芯片产品矩阵。本文将深度解析这四大主流芯片的技术特点与应用场景,为开发者提供选型参考。二、主流语音芯片技术特性全解析2.1 WTN6系列:高性价比的
    广州唯创电子 2025-03-17 09:04 143浏览
  • 晨穹电子一家专业从事研发、生产、销售各类传感器为一体的高新科技企业。1 人赞同了该文章在工业4.0、智能家居、新能源汽车等场景中,传感器作为数据采集的核心器件,其抗电磁干扰(EMC)能力直接影响系统可靠性。尤其在5G通信、高功率电机、无线充电等复杂电磁环境下,传感器的信号失真问题愈发突出。本文结合MEMS传感器、物联网(IoT)设备、边缘计算等热度技术,解析提升传感器抗干扰能力的6大策略。 一、电磁干扰对传感器的威胁; 1、电磁干扰(EMI)会导致传感器出现 。2、信号跳变(
    传感器晨穹 2025-03-18 09:28 79浏览
  • 文/Leon编辑/cc孙聪颖‍蛇年春晚最有意思的节目,一定非机器人跳舞莫属。就算是遥控或预编程,机器人能够做出如此复杂的动作,在五年前都是不敢想象的事情,其制造商宇树科技也因此火爆全网。就在春节过后不到一个月,会骑自行车的人形机器人诞生了。这背后,是近年来“具身智能”概念的迅猛发展。“我们造了一个跟人一样灵动的机器人!”3月11日,智元机器人联合创始人兼首席技术官彭志辉在微博上说道。在视频中,灵犀X2会骑自行车、能跳《科目三》,还可以与人促膝长谈,甚至拿起葡萄“穿针引线”。在全球人形机器人领域,
    华尔街科技眼 2025-03-17 12:38 105浏览
  • 随着汽车行业逐步迈向电气化和电池动力,位置传感器以及其他长期在车辆中被忽视但却至关重要的小型元器件正逐渐成为关注的焦点。某些电子元器件常常吸引大量关注,例如如今用于训练AI模型的强大GPU几乎每天都出现在新闻中。而其他元器件则默默地执行着重要但鲜为人知的功能。艾迈斯欧司朗一些历史悠久的产品线便隶属于后者,其中包括磁性和电感式位置传感器、电容式传感器和电池监控芯片。工业泵和风扇等产品的制造商利用位置传感器实现电动机高效平稳运行。在车辆的方向盘中安装电容传感器可以保障安全,它可以用于在辅助驾驶模式下
    艾迈斯欧司朗 2025-03-17 22:22 65浏览
  • 失效模式与影响分析(FMEA)失效模式与影响分析(FMEA)是一种系统方法,用于识别和分析系统或过程中的潜在失效,广泛应用于工程和制造领域,以提高产品可靠性和安全性。最新标准由 2019 年发布的 AIAG-VDA FMEA 手册(第一版) 定义,该手册结合了美国和欧洲汽车行业的最佳实践,并引入了 七步法,确保分析全面且结构化。图:优思学院六西格玛新版 FMEA 失效分析的七个步骤1. 规划与准备确定 FMEA 研究的 范围、边界和目标。组建跨职能团队(设
    优思学院 2025-03-17 14:43 111浏览
  • 在工业4.0与智能制造深度融合的今天,设备实时性、稳定性和成本效益成为企业核心竞争力的关键。触觉智能将基于RK3506平台,分享工业应用方案,本期为大家带来DSMC串行接口在数控行业的应用。DSMC技术解析底层架构突破双倍数据速率:通过上升沿与下降沿双重触发机制,实现单周期内2倍数据吞吐量,较传统SPI接口效率提升300%。多通道并行:支持8线/16线位宽可配置模式,满足多轴协同场景下的同步通信需求。性能实测标杆超低延迟:FPGA互联场景下,写延时小于75ns,读延时小于260ns,相比PCIe
    Industio_触觉智能 2025-03-18 11:46 42浏览
  • esp32s3使用platformio 点亮1.69寸TFT历程之LVGL移植 继上一篇我历经很久的时间点亮了1.69寸TFT之后。我开始进行LVGL的移植。开始LVGL的学习。用platformio 开发esp32s3真的好方便。按照上一节的环境。本次由于需要使用LVGL。打开platformio lib界面搜索LVGL。目前里面的版本是9.2.2。我使用的8.3.6。然后按照下图加载到自己的工程项目。待加载完毕后。我们会看到libdeps下面会出现LVGL库好了,这一步完成后。我们就开始移植
    zhusx123 2025-03-15 20:58 119浏览
  • 在制药行业中,生产工艺的精准控制与产品质量安全密切相关。随着制药工业4.0的发展,传感器作为生产流程的"感知器官",在确保合规性、提升效率、降低风险方面发挥着不可替代的作用。本文将以晨穹电子科技(以下简称"晨穹")的压力、温度、流量及液位传感器为例,解析制药厂关键工艺流程中的传感器应用场景及技术要求。一、制药核心工艺流程中的传感器需求1. 原料处理与配液系统液位监测:储罐内原料液位实时监控需使用卫生型液位计。晨穹磁翻板液位计采用316L不锈钢材质,具备CIP/SIP(在线清洗/灭菌)耐受性,符合
    传感器晨穹 2025-03-18 15:51 38浏览
  • 近期,据全球物联网市场调研机构IoT Analytics公布数据显示,2025年全球物联网设备连接数预计将突破200亿,同比增长约14%,物联网技术正以稳定上升态势向工业自动化、智慧城市、智慧农业与智慧家居等领域纵深推进。在多样化的应用场景和复杂环境需求的驱动下,物联网无线通信技术的运行功耗、传输距离和频段兼容性正受到前所未有的关注。为增加物联网通信模块的配置灵活度,消除物联网设备的“连接焦虑”,华普微重磅推出了一款自主研发的超低功耗、可兼容Sub-GHz与2.4GHz 双频段的高性能LoRa
    华普微HOPERF 2025-03-18 15:43 35浏览
  • 在招聘合适的人才时,清晰度至关重要。想要找到合适的人选,并确保他们在岗位上取得成功,第一步就是明确职位的关键绩效指标(KPI)和预期成果。但光有这些还不够,如何判断候选人是否具备必要的特质?这时,KSA模型就派上用场了。它是一个简单但强大的方法,能帮助你聚焦于真正影响岗位表现的关键要素。今天,我想和你聊聊这个模型,帮你更轻松地为合适的候选人设定合适的KPI。了解KSA模型KSA代表知识(Knowledge)、技能(Skills)和态度(Attitude),是评估候选人是否适合岗位的三个关键维度。
    优思学院 2025-03-18 15:03 36浏览
  • 新兴的个人健康监测技术为何在医疗场景和日常生活中越来越受到青睐?为了准确回答这个关键问题,我们首先需要理解三个全球性趋势:如今,几乎人手一部智能手机,这等于随身携带了一台高性能计算机、一个全天候运行的智能医疗传感器中心,还有一块显示屏。发达工业国家的人口正在迅速老龄化,而老年群体的疾病发病率较高。与此同时,年轻人也比过去更加关注如何延长健康寿命。这些人群以及服务他们的医务人员可以利用新技术来优化生活方式,合理调控运动、饮食、睡眠和压力等关键因素,帮助他们作出更健康的生活选择。如摩尔定律所预言,半
    艾迈斯欧司朗 2025-03-17 21:50 72浏览
  •        在工业视觉检测线上,一台搭载传统图像传感器的机器人因高温导致图像噪点激增,误将合格零件判定为瑕疵品,每小时损失超10万元;在深夜的安防监控画面中,模糊的噪点让犯罪分子身影难以识别,导致案件侦破延迟—— 噪声,已成为图像传感器行业的“无声杀手”。据Yole统计,全球约35%的工业检测误差源于传感器噪声干扰,而安防场景下60%的有效信息因低照度噪点丢失。传统方案试图通过单一优化像素或电路来降噪,却陷入“按下葫芦浮起瓢”的困境。  &nb
    中科领创 2025-03-18 10:24 34浏览
  • 一、问题现象:语音播放异常的典型表现在使用WT588F(E)系列语音芯片的开发过程中,工程师常会遇到以下两类典型异常现象:播放不全:语音仅播放前段内容后突然中断,或特定段落无法触发播放断续:音频输出存在明显卡顿、爆音或波形畸变某智能门锁项目实测数据显示,在首批样机中有2%的设备出现语音提示突然中断的情况,经排查发现电源电压在播放瞬间跌落至2.0V(低于芯片工作阈值)。这类问题的根源往往隐藏于硬件设计与系统协同的细节之中。二、核心机理:电压稳定性对语音芯片的影响2.1 电源系统的动态响应特性WT5
    广州唯创电子 2025-03-17 09:18 127浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦