Facebook证实目前正在招聘芯片工程师,成立芯片部门并展开ASIC设计。这家社交网络巨擘预计很快地将有5家芯片公司支持其Glow深度学习编译程序…

据Facebook一位高层证实,该公司目前正在招聘芯片工程师,并展开至少一款ASIC设计。在日前于美国加州举行的Facebook @Scale 2018大会上,这家社交网络巨擘宣布,预计将有五家芯片公司支持其Glow——一款开放来源的深度学习编译程序。

Facebook基础架构副总裁Jason Taylor说,Facebook“确实成立了一支专门与芯片供货商合作的芯片团队,同时,我们也在打造自家芯片。不过这当然不是我们的首要关注重点。”他表示,这款芯片“并不等同于Google TPU”深度学习加速器,但他并未提供与这款芯片有关的更多细节或时间表。

Facebook的新芯片部门工作重点之一在于与大约50家设计人工智能(AI)加速器的公司合作。Taylor指出,“市场上将出现许多加速器芯片。但最大的问题在于他们针对的工作负载是否是当前最重要的。”

在主题演讲中,Taylor将Glow描述为一种通用编译程序,让开发人员能够针对云端或网络边缘中任何新兴深度学习加速器进行推论任务。它并不针对智能型手机等客户端系统。

“我们预期(推论加速器)市场将会出现硬件零碎化的情况。我们开发Glow的目的在于协助机器学习专家设计神经网络,而不必面对调整‘每个特定芯片’所需的工作。”

“我们知道硬件零碎化即将发生,因为没有人知道哪一种(硬件)资源的组合——例如芯片上内存区块和乘法累加数组——将会胜出,因此我们让开发人员专注于高层级的图形,而无需为硬件规格手动编码。”
Jason_Taylor_Scale_09_13_18.jpg
Facebook基础架构副总裁Jason Taylor形容Glow是一款为云端和边缘网络进行推论的编译程序(来源:Facebook)

Taylor解释,Glow采用由TensorFlow或Caffe2等架构产生的AI图形,并将其渲染为硬件加速器的位程序代码。根据Facebook的一篇部落格文章,该编译程序内含几种工具,包括为芯片特定内存配置产生有效程序代码的指令排程器、线性代数优化器与内存分配器,以及用于测试硬件精确度的CPU参考建置。

益华计算机(Cadence)、Esperanto Technologies、英特尔(Intel)、Marvell和高通(Qualcomm)等公司都表示未来的芯片将支持Glow。Taylor则表示希望进一步扩展支持名单。“这是Glow作为开放来源的优点之一。”

一位资深芯片专家将Glow描述为在生产系统中部署神经网络的架构。其输入是在TensorFlow或Caffe2等架构中创建的图形。

几家既有的芯片制造商已经提供了类似的软件。例如,英伟达(Nvidia)的Tensor RT自架构中提取图形,并为其GPU输出Cuda程序代码。

传统上,编译程序针对特定芯片进行严密的优化。但是,Taylor说:“近来的编译程序范围比过去的更加广泛——Glow中的优化必须能辨识可以渲染到硬件加速器的大部份图形。”

20180919-facebook.png
转型AI的前兆?

在快速发展的深度学习领域,Glow可说是致力于填补软件和硬件之间差距的最新例证。例如,Nvidia Tensor RT虽然在一年多前才首次发布,至今已进展到第五个版本了。但有些加速器新创公司对于支持各种软件架构及其变化所要求的工作程度也无能为力。

Facebook、微软(Microsoft)和其他公司则都支持ONNX——一种以权重表现图形的标准方法。去年12月,Khronos Group还发布了用于深度学习加速器的硬件抽象层NNEF。

Glow是Pytorch 1.0的一个组成部份。Pytorch 1.0是一个开放来源计划组合,包括合并的Caffe2和Pytorch架构。Pytorch 1.0的第一个开发者大会将于今年10月在旧金山举行。

Facebook工程经理Kim Hazelwood在另一场活动中展示Facebook使用的十几种不同深度学习工作负载,其中至少使用了四种不同类型的神经网络。每天,该AI应用程序(App)产生超过200兆个推论,翻译超过50亿个文本,同时也自动删除至少100万个假账户。

她说,Facebook的一些推论任务需要的运算量是其他任务的100倍。如今,Facebook在其设计的一小部份CPU和GPU服务器上执行这些任务。

Hazelwood在接受《EE Times》访问时说,从通用硬件转向客制硬件,必须为那些仍在定义中的工作负载量身打造芯片。但她拒绝透露Facebook对于使用任何自定义AI加速器的想法。
FB_nn_types.jpg
在至少十几种深度学习app中,仅Facebook本身就采用了至少5种神经网络

一位观察家推测,Glow可说是一款理想的工具,有助于让公司采用适合其工作负载的加速器。Facebook的芯片团队还能协助精选芯片,或许还可以为其提出客制化芯片的建议。

此外,Facebook的一篇博客文章描述它所开发的一款全新软件工具,使用深度学习来除错程序代码。SapFix可以自动产生针对特定错误的修复程序,然后提交给工程师进行审核并部署至生产中。

目前,Facebook已经使用SapFix,加速为使用Facebook Android App的数百万设备发送程序代码更新的过程。Facebook表示将发布该工具的一个版本,但未具体说明时间表。

编译:Susan Hong
 

qrcode_EETCwechat_120.jpg

关注最前沿的电子设计资讯,请关注“电子工程专辑微信公众号”

阅读全文,请先
您可能感兴趣
CMA机构已暂时接受了芯片设计软件制造商新思科技为解决其拟议的350亿美元收购Ansys交易可能引发的竞争问题而提出的补救措施。作为条件性批准的一部分,新思科技承诺将剥离Ansys的PowerArtist业务以及出售自身的光学解决方案集团,以回应CMA对合并后实体可能减少市场竞争的担忧。这一进展标志着此笔EDA领域“世纪大收购”迈向完成的重要一步,预计整个过程将在2025年上半年内完成......
IP供应商、芯片设计服务提供商和AI专家在以AI为中心的设计价值链中的地位正变得更加突出。本文给出了四个设计用例,强调了服务于AI应用的芯片设计模型的重新调整。
芯片设计周期久,决定了AI芯片如果没有在设计之初就“压对宝”,上市时就可能已经过时。有没有什么工具能大幅加速AI芯片的设计流程?
硬件若无软件支持就毫无意义。而软件始终是Arm计算平台不可或缺的一部分,其技术已经涵盖整个软件栈的各个层面。从底层固件和操作系统的开发,到与游戏引擎、开源社区和独立软件供应商(ISV)的战略合作,确保所有这些在Arm平台上都能“开机即用”。
汪洋特别提到,第十三届芯原CEO论坛五大预测之一是2028年用于端侧微调卡和推理卡的销售额将超过用于云侧的训练卡。目前,推理和端侧微调也是芯原重点关注的领域,同时也希望在这一发展趋势中寻找新的机遇。 
随着对复杂IC的需求不断增长,供应商面临着越来越大的压力,需要在尽可能短的时间内交付最高质量的IC。本文阐述了测试工程在交付定制IC以满足这一需求方面的重要性。
对于未来行业发展的增长趋势、行业特征和渠道特点等方面,IDC 总结并给出了2025年中国PC 显示器市场十大洞察……
该存内计算芯片采用全数字设计,能够保证不同位宽配置下的精确计算。为实现不同位宽配置下的高利用率和高能效,团队提出了一种……
西门子数字化工业软件在IDC MarketScape发布的《2024 – 2025全球制造执行系统供应商报告》中被评为MES领导厂商,该报告针对制造业的MES软件厂商进行了综合性评估。
Arm宣布其芯粒系统架构 (CSA) 正式推出首个公开规范,进一步推动芯粒技术的标准化,并减少行业的碎片化。
美通社消息,根据Omdia最新的消费者调查,TikTok和YouTube已成为美国18-35岁人群的领先视频平台。这些平台的发展速度已经超过了Instagram、Facebook和Netflix,巩固
春节黄金学习季!EETOP创芯大讲堂年度最大让利!即日起至2月10日,全站课程直降25%!用一份课程的价格,带走价值130%的芯片行业硬核技能包!【为什么必须抓住这次机会?】 直击行业核心:覆盖集成电
1月21日晚,中国MCU市场龙头兆易创新发布了2024年业绩预告,数据显示:2024年——预计实现营业收入73.49亿元左右,同比增长27.57%左右;预计归母净利润为10.90亿元,同比增长576.
点击上面↑“电动知家”关注,记得加☆“星标”!近期市场较弱,主要是春节前资金面偏紧张造成的,按照每年的惯例,节后资金回流,都会有一个不错的红包行情,现在正是提前布局的关键。如果你还不知道方向,强烈推荐
宇树机器狗今年的 CES 展上,机器人无疑是一大焦点。清洁机器人、工业机器人、医疗机器人、陪伴机器人等引人注目,各大科技公司纷纷展示了机器人在不同场景下的巨大应用潜力。然而,尽管过去几年在大语言模型和
计算存储的通用概念已走入死胡同,但利用固态硬盘(SSD)上巨大的板载带宽的针对性加速器可能有益于高性能计算。几年前,计算存储的概念在业内人士之间引起了讨论。它被吹捧为如何解决如何最大化CPU处理能力的
点击上面↑“电动知家”关注,记得加☆“星标”!电动知家消息,近日,新加坡陆路交通管理局发布的授权经销商新车注册数据显示,2024 年,比亚迪销量由前一年的 1416 辆大增至 6191 辆,市占率 1
当前,人工智能(Artificial Intelligence,AI)发展势头愈发强劲,呈现出一种不可阻挡的迅猛态势。从广为人知的大型语言模型(Large Language Models,LLMs)如
本视频演示,如何将仿真器连接到使用安全ID锁定的RL78设备。  00:00:介绍 00:25:调试  00:40:设定安全ID  相关资源: • Visual Studio Code - 如何在安装
要点 原始设计制造商(ODM)/ 独立设计公司(IDH)产业格局受到地缘政治冲突的影响。闻泰科技已剥离受影响的业务,并专注于半导体业务。立讯精密收购了闻泰的ODM业务,改善了自身的业务布局。随着ODM