Graphcore如何能成为西方半导体业唯一“独角兽”?

面包板社区 2019-07-11 17:23


总部位于英国布里斯托(Bristol,UK)的新创公司Graphcore,开发了一款被称为智能处理单元(intelligence processing unit,IPU)的新型AI加速器;该公司在2016年在风险资本业者的支持下诞生,并在2018年12月进行的最后一轮融资募集了2亿美元。


Graphcore估计市值达17亿美元,被认为是西方半导体产业界唯一的“独角兽”,其投资者包括Dell、Bosch、BMW、Microsoft和Samsung等巨擘。EE Times记者最近采访了Graphcore执行长Nigel Toon (文章上方大图右,左为Graphcore技术长Simon Knowles),畅谈该公司愿景、AI加速器市场以及AI领域未来发展。


EE Times:Graphcore的IPU芯片已经开始销售了吗?以什么形式?


我们的产品已经量产出货以取得营收,目前正在与极少数早期客户合作。我们目前的主要产品是一款可插入服务器的double-width、full-height 300W PCI Express卡,顶部连接器可以实现卡间互连。每一片Graphcore C2卡都配有两颗Colossus IPU处理器芯片;该芯片本身,即IPU处理器,是迄今为止最复杂的处理器芯片──在16纳米单芯片上容纳了240亿个晶体管,每颗芯片可提供125 teraFLOPS运算力。


我们能在一个标准4U机箱中插入8张卡,卡间透过IPU链路互连。卡上的处理器能像是同一个处理单元般共同运作,提供双petaFLOPS的运算力。IPU与CPU和GPU的运算架构不同,能为机器智能提供更高效率的处理平台。这类运算模块能应用于云端运算服务器,也具备进驻自动驾驶车辆的潜力。


EE Times:Graphcore如何因应在数据中心执行深度学习软件堆栈的挑战?


在过去3、4年崛起的标准化深度学习框架,如TensorFlow和PyTorch,搭配ONNX等图形描述子(graph descriptors),能支持某些框架之间的数据交换,让开发人员快速设计神经网络;这些设计基本上是图形框架,也就是说,它们描述了一种包括运操作数(operators)和图形内部元素链接的数学图形。


而我们从这些高阶框架中取得输出并将其输入到我们称之为Poplar的软件层;Poplar扮演我们的映射和编译工具,采用高阶框架图形并将它们映像成为在IPU处理器上执行的完整运算图形。每颗IPU处理器都有1,200个独立的专用核心,以及机器学习所需的所有控制操作和超越函数(transcendental function)。每个IPU核心可执行多达六个程序线程;因此如果你有16颗处理器,在一个4U机箱中可以执行超过10万个独立的平行程序。


正是这种平行化水平,让用户可实现快速训练模型并进行实时操作──这也让我们能够在自然语言处理以及理解自动驾驶车辆应用的视频方面取得重大进展。因此,强大的平行处理能力真的非常重要。


有了Graphcore的IPU,能在处理器内部生成完整的机器学习模型。该处理器具有数百MB的RAM,可在处理器上以超过1.6GHz的速率全速运行;其中的延迟已被程序线程隐藏。若GPU内具备高带宽内存(HBM)等内存技术,还能以更快的速度操控模型。


HBM可达到900GBps的内存带宽,我们的单颗IPU处理器则可约45TB内存带宽;因此一个4U机箱中若有16颗处理器,将带来大量的内存带宽──能平行运作成千上万个程序线程;这是我们得以加快机器智能任务执行速度的部分原因。


EE Times:与市面上领先的GPU方案相较,Graphcore的IPU性能表现如何?


这取决于任务。如果是执行用以分类静态影像的前馈卷积神经网络(feed-forward convolutional neural networks),GPU的表现已经相当好,但IPU可以提供两到三倍的性能优势、有时甚至是五倍。对于更复杂的模型,例如有数据来回传递以尝试理解情境(例如对话)的模型;由于数据被传递多次,需要非常快。对于这样的应用,因为所有的模型都保存在我们的处理器中,IPU可以比GPU快很多,甚至可能快十倍、二十倍或者五十倍。


EE Times:Graphcore是否计划将性能测试结果送交MLPerf或其他基准检验平台?


我们会这么做;目前我们专注在与早期客户合作,帮助他们解决实际问题,但我们会回过头去做一些基准检验。基准检验平台的问题在于它们比较守旧,通常专注于标准的卷积神经网络(CNN),可是这个产业已经往前走了很大步。虽然基准检验是有用的相对衡量标准,但看到产品在实际应用上的真实性能表现也很重要。


创新发展可说日新月异,很难保证你不是“拿苹果跟橘子比”;如果采用标准框架,(为了比较)在不同的系统上进行尝试也很容易。


EE Times:Graphcore的IPU芯片在推论与训练上都适用吗?


是的,你可以用相同IPU芯片进行推论或训练;从架构的角度来看,这对我们非常重要,因为随着机器学习演进,系统将能够从经验中学习。推论性能表现的关键包括低延迟、能使用小模型、小批次(small batches),以及可能会尝试导入稀疏性(sparsity)的训练模型;IPU可以有效地完成所有这些事情。


因此在一个4U机箱中,16颗IPU共同合作协作进行训练,每颗IPU可以执行独立的推论任务,并由一个CPU上执行的虚拟机来控制,最终你会得到一个可用于训练的硬件。因此一旦模型被训练、布署,随着模型演进且我们开始想要从经验中学习时,就可以采用相同硬件。


EE Times:在人才方面,Graphcore将如何培养软件开发工程师,就像是竞争对手Nvidia为CUDA技术所做的?


Graphcore的映射和编译工具Poplar虽然在某种程度上与CUDA差不多,但实际上是一种程序语言,不是在较低层级描述图形的框架。你可以在Poplar中描述一种新型的卷积函数,或一种新型的递归神经网络层,将之视为高阶框架中的函式库元素(library element)。我们可提供各种高阶运操作数与函式库元素,还有许多低阶运操作数;你可以轻松将之互连以创建新的函式库元素,或者是如果你想做一些完全创新的事情,可以使用Poplar C ++环境创建自己的东西。


我们希望大家分享他们的创新让其他人使用。如果你检视Google的TPU或NVIDIA的GPU,会发现很多函式库元素都是封闭的黑盒子,无法看到它们是如何打造;但而我们的是开放的,人们可以进行修改并扩展,我们希望建立的是这样的一个开放社群。


EE Times:在AI领域,Graphcore面对的是包括Google、百度(Baidu)、Nvidia、Intel,以及据说也在开发自家芯片的数据中心巨擘Facebook、阿里巴巴(Alibaba)等对手。Graphcore将如何与那些公司竞争?如果数据中心业者开发自己的AI加速器,市场竞争态势又将如何变化?


我认为会有三个主要市场。首先是一个相当简单的小型加速器市场,通常是以应用于手机的IP核心形式来提供;我们知道一些手机大厂已经在进行这类开发,但我们没有参与这个市场。


还有一个是类似ASIC组件的市场;举例来说,某家公司拥有具备大量用户的特定工作负载──或许他们经营一个很大的社交网络──他们可以在一颗芯片中创建一个非常具体的功能,然后在数据中心布署该芯片以加速执行此功能。这种ASIC类型方案市场也会很大,但我们也没有参与。


我们在做的是一种通用处理器,可以让你用来做许多不同的事情,而且是以惊人的效率。如果该技术应用于云端运算环境,能非常轻松地解决问题,而且功能多样、容易编程,并带来极具效益的结果…我们相信这是一种能在市场上致胜的技术。


人们打造专属ASIC类型芯片的事实,几乎可证明GPU并非市场所需。市场需要的是一种更高效益、容易使用、为机器智能量身打造的处理器,这正是我们所做的。我们认为通用IPU有机会形成迄今最大的一个市场类别,透过为以上所有问题从零开始打造一种更高效益的解决方案,我们相信我们能主导该领域的产业标准。


EE Times:在AI加速器市场俨然成为领导者的GPU,其实在一开始并不是为了这个目的而设计,您认为它会继续占据主流地位吗?


如果只是要做基本的前馈卷积神经网络,GPU是很不错的解决方案,但随着网络变得越来越复杂,人们需要全新的解决方案──这也是为何他们要用ASIC和FPGA。


我们接触过的所有创新者都说,使用GPU会阻碍阻碍他们的创新,而如果仔细看一下他们正在做的模型种类,会发现他们主要采用的是CNN形式,因为递归神经网络和其他种类结构,例如强化学习,不能很妥善地映像在GPU。研究领域因为缺乏够好的硬件平台而受限,这也是为什么我们要将IPU推向市场。


EE Times:Graphcore会进入企业应用市场吗?如果答案是肯定的,你们要如何在竞争对手环伺的该市场脱颖而出?


企业应用市场很有意思,特别是当很多公司正尝试进行真正的深度学习──我们对这个部分特别感兴趣,也并专注于此。问题是,我们该如何接触这类客户?他们遍布全球,分散在不同的垂直市场;对于新创公司来说,这是一个很难进入的市场。


但我们的策略可以说相当“狡猾”──我们与Dell建立了密切的合作关系;Dell是我们公司的投资者,透过与他们合作,我们顺利地进入企业应用市场,并透过多种不同形式将我们的技术提供给客户。举例来说,我们的产品可能是4U规格一体化IPU服务器,也可能是内建单片IPU PCI卡的工作站;我们有很多不同的选项瞄准这个市场,我们也已取得管道。


EE Times:恭喜你们成为西方半导体界的唯一“独角兽”;拥有如此高的身价,Graphcore将如何确保投资者获得良好的投资报酬?


拥有很高的估计市值对我们的公司来说是好事,因为那是公司业务模式的有力验证,而且能让我们可以筹集到大量资金。我们现在拥有具备惊人成长速度的“火力”,这非常重要,因为我们所在的是一个新兴市场;这种动力将在未来的两至三年内发挥作用,我们得在这段时间内跑得非常快,以成为市场上的领先者。


(参考原文:Graphcore CEO Touts 'Most Complex Processor' Ever ,by Sally Ward-Foxton)

本文为EET电子工程专辑 原创文章,禁止转载。




↓↓ 点击图片参与活动 ↓↓


------------------------

与工程师一起改变世

面包板社区 面包板社区——中国第一电子人社交平台 面包板社区是Aspencore旗下媒体,整合了电子工程专辑、电子技术设计、国际电子商情丰富资源。社区包括论坛、博客、问答,拥有超过250万注册用户,加入面包板社区,从菜鸟变大神,打造您的电子人脉社交圈!
评论
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 68浏览
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 44浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 75浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 87浏览
  •     为控制片内设备并且查询其工作状态,MCU内部总是有一组特殊功能寄存器(SFR,Special Function Register)。    使用Eclipse环境调试MCU程序时,可以利用 Peripheral Registers Viewer来查看SFR。这个小工具是怎样知道某个型号的MCU有怎样的寄存器定义呢?它使用一种描述性的文本文件——SVD文件。这个文件存储在下面红色字体的路径下。    例:南京沁恒  &n
    电子知识打边炉 2025-01-04 20:04 100浏览
  • PLC组态方式主要有三种,每种都有其独特的特点和适用场景。下面来简单说说: 1. 硬件组态   定义:硬件组态指的是选择适合的PLC型号、I/O模块、通信模块等硬件组件,并按照实际需求进行连接和配置。    灵活性:这种方式允许用户根据项目需求自由搭配硬件组件,具有较高的灵活性。    成本:可能需要额外的硬件购买成本,适用于对系统性能和扩展性有较高要求的场合。 2. 软件组态   定义:软件组态主要是通过PLC
    丙丁先生 2025-01-06 09:23 85浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 141浏览
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 80浏览
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 116浏览
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 170浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 125浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 104浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦