苹果的M1芯片是苹果在Mac上单核CPU最快的基准芯片,在多核性能上也击败了很多高端Intel竞争对手。苹果M1最大的特点是基于ARM指令集的自主研发,技术含量远高于高通骁龙Kryo内核的“魔改”。其出现的意义在于,一旦成功,将成为扭转ARM和X86攻防态势的时间节点,引领未来更多基于ARM的芯片“。
尽管许多人对苹果 M1 芯片组的基准测试成绩不屑一顾,WCCFTech 还是严肃地指出:与现代 x86 处理器相比,几乎所有单核基准测试都存在根本性的缺陷 —— 假设旨在评估单核性能的话!如您所见,大多数“单核”基准测试并没有让现代 x86 处理器饱和,但 M1 却显得过于忙碌。
(图 via WCCFTech)
此外需要指出的是,Apple M1 采用了非 SMT 架构,但市面上主流的 x86 处理器都支持超线程(比如 Intel 的 HT)以“喂饱”单核负载,因而两者的所谓“单核”基准测试其实有失偏颇。
一位不愿透露姓名的架构师指出:从解码到 uOP,SMT 的理念已被其嵌入到了设计中。通过调度和后续优化,基于复杂指令集(CISC)的现代 x86 处理器,与精简指令集(RISC)架构有着很大的区别。
据悉,RISC 加载 / 存储体系架构的前端解码复杂度更低,因而能够让每个线程在单个时钟周期内榨出更高的性能。相比之下,现代 x86 处理器就需要通过分配多个线程来最大化单核效能。
以 Cinebench 为代表的几乎所有其它基准测试,其考验的所谓“单核”性能,更准确的说法应该是“单线程”性能。而这,正是 x86 体系架构的传统优势。
通常情况下,此类基准测试是在同样支持超线程的产品之间进行比较的。这样一来,不支持超线程的苹果 M1 芯片组就遭到了更加不公平的对待。
值得一提的是,在实际体验中,超线程的效用并不是直接让性能翻番,通常只有 20~30% 左右。为了在苹果 M1 和现代 x86 处理器之间展开更公平的单核性能比较,目前有两种参考方案。
其一是关闭 SMT 技术,使得每个核心都只有一个与之相关联的线程。然而这么一来,从设计之初就考虑到超线程应用的现代 x86 处理器又明显吃亏了。
其二是允许基准测试利用与单个物理核心相关联的两个线程,比如 WCCFTech 就试着将线程 0 和 1 分配给了 Core 0,然后将 Cinebench 配置为仅在多核模式下使用两个线程。
结果让我们感到很是欣喜,可见苹果 M1 的“单核”成绩提升了 20~30%,同时基于 x86 SMT 的处理器也可以充分发挥同一内核中的两个关联线程的性能。
除了 Cinebench,Geekbench 基准测试成绩也平均提升了 20~25% 。感兴趣的朋友还可点击查看 WCCFTech 开展的 9980XE、以及期待 ExtremeTech 的锐龙 4800U 的基准测试。
WCCFTech 最初的基准测试横评表明,英特尔 Tiger Lake 平台的单核 / 单线程性能都胜过苹果 M1 。与此前的 1510 分相比,如果启用新的对比方案,现代 x86 平台还可将领先优势扩大到 19% 。
鉴于 SMT 的性能提升在 20~30% 之间,即便用最差的情况来对比,现代 x86 处理器也不至于太过逊色。