Hot Chips一向是处理器产业尖端技术与最新发展趋势的风向球,今年也不例外。如果说Hot Chips 2019是否透露任何迹象,那就是这一场机器学习/ AI芯片革命正方兴未艾…

“摩尔定律”(Moore’s Law)是今年芯片领域年度盛会——Hot Chips大会上两大专题演讲的关注焦点。AMD首席执行官苏姿丰(Lisa Su)解释为什么应用必须超越摩尔定律,而台积电(TSMC)技术研究副总经理黄汉森(Philip Wong)则强调摩尔定律不死且依然有效(至少对于晶体管密度而言)。

Lisa Su认为,先进芯片的成本将持续增加,这也就是为什么AMD开始转向小芯片(chiplet)策略。黄汉森虽然未提及成本,但提供了多种形式的多芯片封装解决方案,似乎也再次强调与Lisa Su同样的论点。
20190828-hotchips-2+.jpg
Hot Chips大会主席John D. Davis为年度盛会Hot Chips 2019揭开序幕(来源:TIRIAS Research)

Hot Chips大会定于每年八月举行,今年在美国斯坦福大学(Stanford University)纪念礼堂(Memorial Auditorium)举行的开幕式人潮盛况空前,吸引了大约1,200人参与这场活动。究竟是因为演讲内容精彩可期?活动的宣传与推广成功?还是近期流向机器学习芯片的资金泡沬化?虽然很难确定是什么原因吸引如此热情的参与,但无疑地,“机器学习”(machine learning)是今年Hot Chips活动的主轴,有一半的演讲都与机器学习和神经网络处理有关。

Cerebras:晶圆级引擎

在今年Hot Chips发表的演讲中,最受瞩目的要算是Cerebras的晶圆级机器学习处理器了。这是该公司自成立以来的首次详细介绍,但在其演讲中仅简单提到建构晶圆级芯片所需的技术。Hot Chips大会主席John D. Davis介绍它是Hot Chips大会有史以来“最热门的芯片”(hottest chip ever)——尽管演讲中并未着墨太多,但据称该芯片功耗为15kW,以该芯片每边宽约8.5英寸的尺寸规格而言,这一功耗实在让人难以想象。该公司确实扩大了我们对于何谓打造一款“大”芯片的概念。

Nvidia:单芯片堆栈‘Compute tile’

当Cerebras致力于打造并量产号称史上最大芯片之际,其他厂商则积极寻求如何解析至今所开发的更大尺寸芯片。或许最大的反差就是来自Nvidia Research开发的项目。Nvidia Research的RC18测试芯片专为可扩展的深度学习推理而设计,在单一芯片封装中堆栈了36个“运算砖”(compute tile)裸晶。基于16nm工艺的RC18超小核心运算砖可实现9.5TOPS/W总共高达128TOPS的运算能力。采用接地参考信令(GRS)的高速互连支持每条链路100Gbps的多播功能,以及基于代码(token-based)的芯片到芯片协议,以连接封装中的裸晶。近十位研究人员采用高阶抽象(C++)自动化设计和敏捷设计,在6个月的时间内让芯片从规格制定到投片,显示一支小型团队即可产生快速上市的解决方案。

MCP和Chiplet技术

多芯片封装(MCP)和小芯片技术也是整个大会期间的亮点,包括AMD、英特尔(Intel)、Nvidia和TSMC都有相关的产品和技术发布。英特尔展示一种使用Foveros的芯片堆栈技术将完整Lakefield PC平台(处理器和内存)封装成极其紧密封装的方法。Lakefield并采用异构处理器配置,在一个芯片中整合了一款大型的x86 CPU核心和四个较小的Atom核心。该10nm+ Lakefield处理器芯片的待机功耗极低,并使用电源管理芯片(PMIC)进行电源管理。下图显示执行图像密集型工作负载时的峰值功率约为7W。
20190828-hotchips-3.jpg
Lakefield Foveros(来源:TIRIAS Research)

基准(Benchmark)检验

另一个有趣的演讲着眼于机器学习芯片的基准检验。支持MLPerf的产业联盟介绍其最新的机器学习训练基准。该联盟包括一些重量级业者,包括Arm、英特尔、Facebook、Google、Nvidia和赛灵思(Xilinx)。即使相关规格的制定仍处于早期发展阶段,几家厂商已经先行发布了初步的数据。遗憾的是,机器学习推理的基准尚未完成。此外,MLPerf并未针对更严格的稀疏数据应用进行基准检验。

针对稀疏数据的问题,Facebook讨论其Zion平台如何进行机器学习训练。有趣的是,Facebook还统一其CPU和加速器训练平台,以便使用新的BFLOAT16数据格式(BFLOAT16基于IEEE 32位浮点格式,尾数被截断至7位)。

Habana、华为、英特尔和Xilinx

Habana、华为(Huawei)、英特尔和Xilinx也分别发表其机器学习和神经网络芯片。华为详细介绍其达芬奇(DaVinci)神经网络(NN)加速器。DaVinci设计独特,专为从物联网(IoT)设备扩展到数据中心而设计。该公司正致力于将NN处理器整合到其多样化的芯片设计中。华为的演讲进行方式也很特别,由于主讲人未能顺利申请到美国签证,因而准备了高画质的视频演讲,之后再以电话会议的方式开放提问。

英特尔发表其Spring Crest (NNP-T) 机器学习训练芯片和NNP-I推理引擎。 NNP-T组件基于Nervana芯片架构,现已移植到台积电的16nm工艺。这款内含270亿颗晶体管的芯片尺寸约680mm2,采用1200mm2中介层以及32GB HBM2-2400内存。该芯片设计符合Facebook的开放加速器模块(OAM)外形,并支持BFLOAT16数据格式。

英特尔另一款芯片——NNP-I Spring Hill推理芯片将采用M.2 PCIe外形配置。它针对约4.8TOP/W的主要数据中心推理工作负载,提供同类最佳的性能/功效比。Spring Hill采用英特尔10nm工艺制造。

Habana更新去年推出的Goya推理卡,并介绍现正进行评估的Gaudi训练板最新发展。如同英特尔的Spring Crest,Gaudi训练芯片也支持BFLOAT16数据格式,并以Open Compute Project (OCP) OAM提供。Gaudi的芯片到芯片互连采用标准RDMA RoCE over PCIe 4.0接口。

Xilinx的7nm Versal VC1902 ‘ACAP’芯片拥有370亿颗晶体管和大约1GB的片上内存。Versal于2018年推出,现正评估样片中。

尽管在Hot Chips涌现一波机器学习和神经网络处理器浪潮,但也有一些更加传统的产品与技术展示,包括AMD的Zen 2 (Matisse处理器)和Navi GPU、Arm的N1服务器核心、IBM的POWER 9 AIO、英特尔的Lakefield PC处理器、Nvidia的图灵(Turing) GPU及其光线追踪加速功能等。

芯片拆解也是IBM Power 9 AIO及其Open Memory Interface (OMI)的关键部份,它提供了一种从处理器芯片中移除内存控制器并将其置于内存模块的方法。该OMI逻辑约为DDR内存驱动器面积的六分之一,透过OMI使用跨平台的CPU芯片内存。微芯科技(Microchip)推出了一款OMI DDR4内存缓冲芯片。IBM并介绍其OpenCAPI加速器接口,指称其开放与英特尔CXL标准融合的途径。

Hot Chips是业界发表最新技术的独特场合,许多不在其他会议中谈论的芯片通常会在此处亮相。例如微软(Microsoft)深入探讨HoloLens 2采用的芯片,而特斯拉(Tesla)则讨论在其内部设计的车用客制ADAS芯片。
20190828-hotchips-4.jpg
TESLA ADAS控制器配备冗余客制芯片(来源:TIRIAS Research)

除了在Hot Chips大会上发表的演讲数据极其重要且相当技术性,与会者也从这场盛会中发现了其他的乐趣。今年,英特尔在斯坦福大学校园附近举办了一场特别的展后活动,Raja Kaduri和Jim Keller即在此接受访问。

Hot Chips无疑是与芯片业重量级业者和重要人士会面与交流的绝佳场所。这场盛会一向是展现处理器产业尖端技术与最新发展趋势的风向球,今年也不例外。如果说Hot Chips 2019是否透露任何迹象,那就是这一场机器学习/人工智能(AI)芯片革命正方兴未艾。

编译:Susan Hong,EETimes Taiwan

责编:Luffy Liu

参考原文:Hot Chips 2019 Has Never Been Hotter, or Bigger,by Kevin Krewell

 

阅读全文,请先
您可能感兴趣
半导体行业正迎来一个新的建设高峰期,SEMI预测,2025年,全球范围内将有18个新的晶圆厂项目开始建设,其中15座为12英寸晶圆厂,3座为8英寸晶圆厂,大部分预计将于 2026 年至 2027 年开始运营......
尽管Imagination在RISC-V领域取得了一定的成就,但公司似乎认为继续投入资源于RISC-V处理器核心的开发并不符合其长期战略目标。Imagination决定终止其基于RISC-V指令集架构的GPGPU内核的研发工作,并将重心转向其擅长的GPU和AI领域......
这款机器人头上的摄像头可以录制视频或使用人工智能识别物体,虽然该机器人的动作仅限于挥动细小的手臂和眨动动画眼睛,但它可以与一把小型电动椅子配对,自动在家中导航。
Ken Glueck认为,美国2800亿美元的芯片法案所取得的成就,将被出口管制框架夺走,“因为在一项IFR中,它成功地将美国公司的全球芯片市场缩小了80%,并将其交给了中国。”
英特尔临时联席CEO Michelle Johnston还表示,“英特尔会在2025年及以后继续增强AI PC产品组合,向客户提供领先的英特尔18A产品样品,并在2025年下半年量产”。
NVIDIA刚才在CES上发布了GeForce RTX 50系显卡,据说这一代的5070就能达到上代4090的性能水平...
• 目前,iPhone在翻新市场中是最热门的商品,并将长期主导着翻新机的平均销售价格。 • 全球翻新机市场持续向高端化发展,其平均销售价格(ASP)现已超过新手机。 • 新兴市场是增长的最大驱动力,消费者对高端旗舰产品有着迫切需求。 • 由于市场固化和供应链的一些问题限制推高中国、东南亚和非洲等大市场的价格。 • 2024年,这些翻新机平均销售价格将首次超过新手机。
从全球厂商竞争来看,三季度凭借多个新品发布,石头科技市场份额提升至16.4%,连续两季度排名全球第一……
最新Wi-Fi HaLow片上系统(SoC)为物联网的性能、效率、安全性与多功能性设立新标准,配套USB网关,可轻松实现Wi-Fi HaLow在新建及现有Wi-Fi基础设施中的快速稳健集成
其中包含Wi-Fi 7和蓝牙5.4 模组FME170Q-865、Wi-Fi 6和蓝牙5.4 模组FCS962N-LP、Wi-Fi 6和蓝牙5.3模组FCU865R 、独立Wi-Fi和蓝牙模组FGM840R、高功率Wi-Fi HaLow模组FGH100M-H……
1月7日,据韩媒 sisajournal-e 消息,三星计划 2025 年下半年推出三折叠手机,采用 G 形双内折设计,完全展开后尺寸为 12.4 英寸。据称,有别于华为的 S 形折叠屏方式(In&O
01周价格表02周价格观察硅料环节本周硅料价格:N型复投料主流成交价格为40元/KG,N型致密料的主流成交价格为38元/KG;N型颗粒硅主流成交价格为35元/KG。供给动态头部料企继续推进减产策略,月
随着Mini/Micro LED技术发展和小间距产品成熟,LED显示行业在更多细分场景下的高增长潜力正在加速释放。Mini LED背光市场自2021年进入起量元年后,年复合增长率达50%;Micro
亚化咨询重磅推出《中国半导体材料、晶圆厂、封测项目及设备中标、进口数据全家桶》。本数据库月度更新,以EXCEL表格的形式每月发送到客户指定邮箱。中国大陆半导体大硅片项目表(月度更新)中国大陆再生晶圆项
 △广告 与正文无关 日前,苏州西典新能源电气股份有限公司(股票代码:603312,以下简称“西典新能”)发布公告称,公司经过3年多的产品和工艺研发及设备攻关,信号采集组件FCC技术取得重大进展,公司
日前,微信安卓版迎来8.0.56正式版更新,这是2025年首次版本更新。关于更新内容,依然是那9个字:“修复了一些已知问题”。虽然官方没有公布具体更新内容,但体验后发现,新版增加了朋友圈视频倍速播放等
  在千级电子净化车间中设置通风系统时,需要综合考虑多个因素,包括洁净度要求、换气次数、气流组织、空气处理、温湿度控制以及节能与环保等。以下是合洁科技电子洁净工程公司的一些具体的设
戴尔科技AI PC产品组合助力终端用户释放创造力并提高工作效率。 戴尔科技统一旗下产品组合品牌命名,旨在帮助用户更轻松、快速地找到相匹配的PC、配件及服务。 搭载英
 △广告 与正文无关 1月3日,The Elec援引电子元件专业媒体内容表示,尽管取代中国PCB的努力仍在继续,但预计到2028年,中国(包括大陆和台湾省)在全球PCB销售中的份额将超过60%,在市场
1月8日消息,据外媒报道,由于半导体行业需求衰退,日本瑞萨电子将在日本及海外裁员数百人,并且定期加薪也将被推迟!据报道,瑞萨电子在日本和海外有约21,000名员工,本次裁员比例近5%。这一裁员计划已于