4月20日,Cerebras Systems 公司再次刷新历史,推出为超级计算机任务而打造的第 2 代 Wafer Scale Engine (WSE-2)芯片。与一代WSE相比,WSE-2虽然在面积上没有变化,但却拥有创纪录的 2.6 万亿个晶体管以及 85万个 AI 优化的内核,芯片的所有性能特征,包括:晶体管数、内核数、内存、内存带宽和结构带宽,均比一代增加了一倍以上。

差不多两年前(2019年8月),SeaMicro 创始人安德鲁·费尔德曼(Andrew Feldman)创办的 Cerebras  Systems 公司公司,揭开了芯片设计领域的一场革命,他们将整片晶圆制成了一个巨大的芯片。

以往的芯片制造流程,是从硅锭切下一片晶圆后在Fab中进行加工,一片晶圆能被切成数百颗独立的芯片。而这颗名为晶圆级引擎(Wafer Scale Engine,WSE-1)的处理器直接把整片晶圆做成了一颗芯片,面积与12英寸晶圆所能截取的最大矩形面积一样——比iPad还大。

不过,这颗芯片的每一块区域都能被称为内核,它们以一种复杂的方式与其他内核相互连接。互联的设计是为了保持所有内核的高速运转,以便所有晶体管能够作为一个整体一起工作。在 2019 年推出的WSE-1中,Cerebras 融入了 40 万个内核和 1.2万亿个晶体管,采用的是 16 纳米工艺进行制造,可同时专注于AI和HPC(High Performance Computing,高性能计算机群)工作负载。

更狠的第二代(WSE-2)来了

4月20日,Cerebras Systems 公司再次刷新历史,推出为超级计算机任务而打造的第二代 Wafer Scale Engine (WSE-2)芯片。与一代WSE相比,WSE-2虽然在面积上没有变化,但却拥有创纪录的 2.6 万亿个晶体管以及 85万个 AI 优化的内核,芯片的所有性能特征,包括:晶体管数、内核数、内存、内存带宽和结构带宽,均比一代增加了一倍以上。

这得益于WSE-2采用基于台积电(TSMC)的N7工艺(7nm)打造,使得逻辑电路可以按比例缩小,并在一定程度上缩小了SRAM,让新芯片上可以容纳更多AI内核。Feldman 说,有了这样的先进工艺支持,Cerebras 可以在同样的8*8英寸,面积约46225mm2的芯片中塞进更多的晶体管。

WSE-2与一代对比(图自:AnanTech

值得注意的是,在功能提升的前提下,Cerebras还能够保持其系统功耗不变(23 kW)。

对比市场上第二大AI处理器,英伟达的Ampere A100面积约为826mm2,具有0.054万亿个晶体管。WSE-2比它多了2.55万亿个晶体管;内核数是A100的123倍;缓存是其1000倍;可提供的内存带宽,则达到了A100的13万倍。

Cerebras还引用了1000倍的板载内存,带有40 GB的SRAM,而Ampere A100则为40 MB。

 

最初推出WSE-1的时候,很多人担心这么大的晶圆做芯片,万一其中一块不良,是否整个报废?对此Cerebras解释说,他们通过设计一种可以绕开任何制造缺陷的系统来实现100%的良率,核心与带有FMAC数据路径的2D Mesh连接

Cerebras在WSE-1用了1.5%的额外核心来容纳缺陷,但由于台积电工艺的提升,这个数值被进一步缩小了。

晶圆级引擎存在的意义 

WSE的出现,是因为训练神经网络需要花费较多的时间,即便是当今最先进的模型,也需要几天或几周的时间进行训练,大型网络则需要数周。通常做法是在数十、数百甚至数千个GPU上进行分布式训练,以使训练时间更可控。

其中最大的瓶颈,是这些庞大的处理器集群很难编程,而且数据必须在处理器和外部 DRAM 存储器之间进行多次传输,既浪费时间又消耗能源。所以WSE研发团队的初衷是扩大芯片,使它与 AI 处理器内核一起容纳所需的所有数据,一个CS-2的性能相当于整个GPU集群的性能,同时具有单个设备的简单性。。

其设计的关键是自定图形编译器,采用pyTorch或TensorFlow将每一层映射到芯片的物理部分,从而允许在数据流过时进行异步计算。拥有如此大的处理器意味着数据永远不会掉队,也不需要在内存中等待,不浪费功率,并且可以以流水线的方式连续地移至计算的下一个阶段。编译器和处理器的设计还考虑到了稀疏性,无论批处理大小如何都可以实现高利用率,或者可以使参数搜索算法同时运行。

Cerebras设计的独特性,让它能够超越制造过程中出现的常见物理限制,即标线限制。处理器的设计限制,往往取决于芯片的最大尺寸,因为很难通过Cross link连接两个区域。这是Cerebras的杀手锏之一,该公司仍然是唯一一家能提供这种规模处理器的公司。

在Hot Chips 2020,该公司首席硬件架构师Sean Lie表示,Cerebras对客户的主要好处之一是能够简化工作负载,以前需要使用GPU / TPU机架的工作,现在可以以计算相关的方式在单个WSE上运行。

产品和合作伙伴

Cerebras的第一代WSE作为CS-1的完整系统的一部分一起打包出售,不少实验室与计算机中心已经部署了Cerebras WSE和CS-1。

  • 爱丁堡大学的超级计算中心,利用WSE进行自然语言处理、基因组学和COVID-19的相关研究。
  • 在美国阿贡国家实验室(ANL),WSE被用于COVID-19研究、重力波检测和材料发现等;并且在癌症疗法研究中,使癌症模型的实验周转时间,减少了300倍以上。
  • 制药企业葛兰素史克的高级副总裁金·布兰森表示:“其增加了生成的编码器模型的复杂性,同时将训练时间减少了80倍。”
  • Lawrence Livermore将一台CS-1与其23 PFLOP“拉森”超级计算机配对。匹兹堡超级计算机中心以500万美元的价格购买了两个系统,并将这些系统连接到他们的Neocortex超级计算机上,以实现同步AI和增强的计算能力。

对于WSE-2的应用,国际调研公司Tirias Research首席分析师Jim McGregor认为:“显然,对用于大型数据集的Cerebras晶圆级解决方案,有些公司和实体很感兴趣。但是在企业层面,还有数百万的其他AI应用,以及一些Cerebras不能处理的情况,这就是英伟达拥有SuprPod和Selene超级计算机的原因。与英伟达相比,Cerebras更像是一个小众平台,二者的广度无法相提并论。”

目前Cerebras在多伦多、圣地亚哥、东京和旧金山拥有约300名员工。该公司首席执行官安德鲁·费尔德曼(Andrew Feldman)表示,作为一家公司,他们已经实现了盈利,已经部署了CS-1的客户很多,并且在启动商业系统时已经有更多的客户在远程试用CS-2。 

除了AI之外,由于芯片的灵活性使流体动力学和其他计算仿真成为可能,因此Cerebras在典型的商业高性能计算市场(例如石油、天然气和基因组学)中吸引了很多客户。

CS-2的部署将于今年晚些时候的第三季度开始,价格已从2-3百万美元升至“几百万”美元。

责编:Luffy Liu

阅读全文,请先
您可能感兴趣
有鉴于电动汽车、自动驾驶和人工智能业务等未来增长潜力,以及在马斯克在当选总统特朗普政府中的“特殊地位”,多家分析机构认为,马斯克的财富未来还将进一步增长。
今年初的GTC上,黄仁勋就说机器人的“ChatGPT时刻”要来了。也就是说这波AI驱动的机器人热潮要来了...最近的ROSCon China 2024大会似乎也能看到这种迹象...
人工智能(AI)功能已经在各种移动设备中变得至关重要。尤其是2024年,AI PC陆续推向市场,甚至可以称为“边缘设备AI元年”。 这次我们就来盘点一下2024年下半年发布的主要AI PC和处理器。
借着传说中Intel在中国举办的有史以来规模最大的生态大会,谈谈AI PC生态于2024收官之际大致发展到了哪儿...
锡作为AI技术生产的重要原料之一,其需求有望成为新的增长点。而中国有色矿业公司也希望锁定这种在关键矿物清单上占据重要地位的锡的供应。
HBM4将用于特斯拉正在开发的AI数据中心及其自动驾驶汽车。其中,特斯拉采购HBM4芯片将用于强化其超级电脑Dojo的性能。
目前,智能终端NFC功能的使用频率越来越高,面对新场景新需求,ITMA多家成员单位一起联合推动iTAP(智能无感接近式协议)标准化项目,预计25年上半年发布1.0标准,通过功能测试、兼容性测试,确保新技术产业应用。
中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案,首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……
C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置,为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。
投身国产浪潮向上而行,英韧科技再获“中国芯”认可
点击蓝字 关注我们安森美(onsemi)在2024年先后推出两款超强功率半导体模块新贵,IGBT模块系列——SPM31 IPM,QDual 3。值得注意的是,背后都提到采用了最新的FS7技术,主要性能
近期,多个储能电站项目上新。■ 乐山电力:募资2亿建200MWh储能电站12月17日晚,乐山电力(600644.SH)公告,以简易程序向特定对象发行A股股票申请已获上交所受理,募集资金总额为2亿元。发
‍‍12月18日,深圳雷曼光电科技股份有限公司(下称“雷曼光电”)与成都辰显光电有限公司(下称“辰显光电”)在成都正式签署战略合作协议。双方将充分发挥各自在技术创新、产品研发等方面的优势,共同推进Mi
投资界传奇人物沃伦·巴菲特,一位94岁的亿万富翁,最近公开了他的遗嘱。其中透露了一个惊人的决定:他计划将自己99.5%的巨额财富捐赠给慈善机构,而只将0.5%留给自己的子女。这引起了大众对于巴菲特家庭
来源:IT之家12 月 18 日消息,LG Display 韩国当地时间今日宣布,已将自行开发的“AI 生产系统”投入到 OLED 生产线的日常运行之中,该系统可提升 LG Display 的 OLE
“ 洞悉AI,未来触手可及。”整理 | 美股研究社在这个快速变化的时代,人工智能技术正以前所未有的速度发展,带来了广泛的机会。《AI日报》致力于挖掘和分析最新的AI概念股公司和市场趋势,为您提供深度的
近期,高科视像、新视通、江苏善行智能科技等企业持续扩充COB产能。插播:加入LED显示行业群,请加VX:hangjia188■ 高科视像:MLED新型显示面板生产项目(二期)招标12月18日,山西高科
又一地,新型储能机会来了?■ 印度:2032储能增长12倍,超60GW据印度国家银行SBI报告,印度准备大幅提升能源存储容量,预计到2032财年将增长12 倍,超60GW左右。这也将超过可再生能源本身
在上海嘉定叶城路1688号的极越办公楼里,最显眼的位置上,写着一句话:“中国智能汽车史上,必将拥有每个极越人的名字。”本以为这句话是公司的企业愿景,未曾想这原来是命运的嘲弄。毕竟,极越用一种极其荒唐的
极越汽车闪崩,留下一地鸡毛,苦的是供应商和车主。很多人都在关心,下一个倒下的新能源汽车品牌,会是谁?我们都没有未卜先知的超能力,但可以借助数据管中窥豹。近日,有媒体统计了15家造车新势力的销量、盈亏情