点击蓝字 关注我们
SUBSCRIBE to US
GRAPHCORE
总部位于英国的AI计算机公司Graphcore在不改变其专用AI处理器核心的情况下,极大地提高了计算机的性能。重点在于,制造过程中使用了台积电的Wafer-on-Wafer 3D集成技术,将供电芯片连接到Graphcore的AI处理器。
Graphcore 高管表示,这种名为Bow的新型组合芯片适用于伦敦的一个地区,是市场上第一个使用晶圆对晶圆键合的芯片。添加供电硅意味着Bow可以运行得更快 —— 1.85GHz,而不是1.35 GHz,比前代产品的电压更低。这就意味着,与上一代计算机相比,计算机训练神经网络的速度提高了40%,能耗降低了16%。重要的是,用户无需更改其软件即可获得这种改进。
Graphcore首席技术官兼联合创始人Simon Knowles表示:“我们正在进入一个先进封装的时代,在这个时代中,多个硅芯片将被组装在一起,以补充我们在不断放缓的摩尔定律道路上不断取得进步所带来的性能优势。”Bow及其前身Colossus MK2均使用相同的制造技术,即台积电的N7制造。
GRAPHCORE
GRAPHCORE
在其他3D芯片堆叠技术中,比如英特尔的Foveros,已经删除的芯片被连接到其他芯片或晶圆上。在台积电的 SoIC WoW技术中,两个完整的芯片晶圆是键合的。每个芯片上的铜焊盘在晶圆对齐时匹配。当两个晶片被压在一起时,焊盘熔断。Knowles说:“可以将其视为焊盘之间的一种冷焊。”然后将顶部晶圆减薄至仅几微米,并将键合晶圆切割成芯片。
在Graphcore的案例中,其在一块晶圆上填满了该公司的第二代AI处理器,拥有1472个智能处理单元(IPU)和900MB片上缓存。这些处理器已在商业系统中得到应用,并在最近一次MLPerf基准测试中交出了相当不错的答卷。至于另一个晶片,其拥有一套相应的供电芯片(不包含晶体管或其它有源器件),配备了电容并通过硅通孔(TSV)来垂直连接。
值得一提的是,真正起作用的是电容器。电容器组件形成在硅片上深且窄的沟槽中(类似DRAM)。通过将这些电荷储存组件放置在靠近晶体管的位置,以实现更平滑的功率传输,从而使IPU内核在较低电压下运行得更快。若缺乏这一方案,Graphcore就必须将IPU工作电压提升到更高,才能维持1.85GHz的工作频率。此外借助电源芯片,也可助力其达成该时钟频率、并减少能源开销。
GRAPHCORE
Graphcore高管补充道,Wafer-on-Wafer技术使得芯片之间的链接密度可高于将单个芯片连接到晶圆上,但也面临一批晶圆中难免有少数存在缺陷的问题。通过键合两片晶圆,会使得成品芯片的缺陷率翻番。为了缓解这种情况的发生,Graphcore选择了一套机智的应对方法 —— 与其它AI处理器一样,IPU由许多重复、冗余的处理器内核和其它部分组成。公司联合创始人兼首席执行官Nigel Toon指出,任何缺陷都可通过内置的保险电路,让它们与IPU的其余部分隔离开来。
有趣的是,尽管Bow尚未在供电芯片上堆砌晶体管,但Simon Knowles暗示道 —— 当前工作只能算是迈出了第一步,该公司将在不久的将来“走得更远”。此外该公司披露了一些计划,比如将打造可训练“人脑规模”人工智能的超级计算机 —— 在神经网络中具有数百亿的参数数量级。
微信号|IEEE电气电子工程师
新浪微博|IEEE中国
· IEEE电气电子工程师学会 ·
往
期
推
荐
全息技术“量子飞跃” 可用于间接医学成像等
动态充电:电动汽车在行驶中充电
准粒子用于每秒产生数百万个真正的随机数
机器人技术与未来的工作:未来几年的预期情况