广告

人工智能有了新的机器学习测试基准

时间:2018-05-07 08:55:43 作者:Rick Merritt 阅读:
Google、百度与哈佛大学、斯坦福大学连手为机器学习定义了一套新的测试基准——MLPerf,初期将专注于各种系统的训练任务,未来还将进一步扩展至推论以及执行于嵌入式客户端系统等。
广告

Google、百度(Baidu)与来自哈佛大学(Harvard University)、斯坦福大学(Stanford University)的研究人员合作,连手为机器学习(machine learning)定义了一套新的测试基准(benchmark)——MLPerf。目前,包括AMD、英特尔(Intel)以及两家人工智能(AI)新创公司和另外两所大学都表示支持MLPerf,最初版本预计将于8月份投入使用。

当今的硬件在执行神经网络作业时还无法达到业界所期望的性能标准。因此,一连串新的加速器陆续出现在市场上,但相关产业却缺乏有效测量其性能表现的方法。

为了填补这一空白,MLPerf的第一个版本将专注于各种系统的训练任务,包括从工作站到大型数据中心;这方面的任务一直是Google和百度等网络巨擘的最大痛点。后续发布的版本将延伸至推论任务,最终并扩展至包括执行于嵌入式客户端系统的版本。

百度深度学习资深研究员Greg Diamos举例说,以训练模型的大小及其数据组合来看,“为了训练我们真正想要执行的一种模型,大约需要以我们所有的GPU执行约两年的时间。”

Google Brain计划的主任工程师Peter Mattson在5月2日的MLPerf发布活动中说:“如果系统变得更快,我们就能更快地释放机器学习的潜力。”

可在各种AI架构上执行的套件早期版本将在3个月内准备就绪。届时,该组织的目标在于召集工作小组并打造出更完整的版本。

Mattson说:“我们最初称其为版本0.5……这是经由一支研究小组完成的,现在我们希望开发社群能够成功打造版本1.0,使其成为人人都能拥有的东西。我们鼓励各种反馈…提出有关工作负载、基准定义与结果的建议,让我们能迅速更新”基准。
20180507-MLperf-1
MLPerf的支持者与竞争者

大约有来自6家芯片公司、4家数据中心营运商与4所大学的35人都受邀参与了4月12举行的秘密会议,先行审视了有关MLPerf基准的计划。从那时起,组织者们开始努力争取更多支持者。

其他宣布支持MLPerf的单位还包括加州大学伯克利分校(UC Berkeley)、明尼苏达大学(University of Minnesota)和多伦多大学(University of Toronto),以及两家AI新创公司SambaNova和Wave Computing。

去年12月,服务器效能评测标准组织“事务处理效能委员会”(Transaction Processing Performance Council;TPC)宣布正在组建一个定义AI基准的小组。Mattson说:“在此领域的几个基准如今都参与了我们的计划……为此领域聚焦于一个共同的基准,可望带来长期的效益。”

中国搜寻巨擘百度最早采取行动,率先在2016年9月就发布了DeepBench,这是一个开放源码的底层测试基准,使用其工作负载进行训练。Diamos表示,该公司现在将专注于针对应用层级性能的MLPerf。.

Diamos解释说:“DeepBench专注于底层的编程接口,因为它们可以跨硬件移植,但为了取得更准确的指标,我们必须评估完整的应用程序(App)”,以及来自许多公司的工作负载。

最初,MLPerf将测量训练模型的平均时间到最低限度的质量表现,可能以小时为单位。有鉴于这些工作是在大型服务器数组上执行的,可能不会回报每瓦性能。只要价格不至于随着运行时间进展而变化,就会将工作成本纳入考虑。

Nvidia的P100 Volta芯片将是该基准的一项参考标准,因为它已经广泛地被数据中心用于训练了。该组织打算每3个月更新一次发布的结果。

MLPerf将使用两种模式。针对商业用户的封闭衡量指针将会指定一种使用模型和数据集,并限制关键参数(如批次大小)的值;针对研究人员的开放指标则设限较少,让用户能试验该新途径。

编译:Susan Hong

本文授权编译自EE Times,版权所有,谢绝转载

EETC wechat barcode


关注最前沿的电子设计资讯,请关注“电子工程专辑微信公众号”。

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
Rick Merritt
EE Times硅谷采访中心主任。Rick的工作地点位于圣何塞,他为EE Times撰写有关电子行业和工程专业的新闻和分析。 他关注Android,物联网,无线/网络和医疗设计行业。 他于1992年加入EE Times,担任香港记者,并担任EE Times和OEM Magazine的主编。
  • 英特尔:以开源开放构建企业AI落地的艺术 尽管生成式AI令人感到惊喜,但很多创新还没有真正落实到每个用户或企业的AI应用上。为了开发出真正不可或缺的“AI杀手级应用”,必须加快创新步伐,激励更多开发者致力于AI领域的开发和创新活动。
  • 英国正在调查新思科技350亿美元收购Ansys的交易,确保不影响英国市场竞争 为了确保英国市场的竞争不受影响,CMA将对这一收购事宜进行调查。CMA称,允许相关方提交有关该交易可能对英国竞争产生影响的初步意见。
  • 蔚来成功流片智驾芯片“神玑 NX9031”,“全球首颗”定义被质疑 “神玑 NX9031”采用5nm车规工艺制造的高阶智能驾驶芯片,其芯片和底层软件均已实现自主设计,拥有超过500亿颗晶体管。该芯片采用32核超强CPU架构,并集成了高性能图像信号处理器ISP和各类推理加速单元NPU,能够灵活高效地运行各类AI算法。
  • 微软指责欧盟政策应该对“蓝屏”事件负责 微软还指出,由于与欧盟达成的协议,公司无法做出类似的改变来提高操作系统的安全性。因此,当第三方安全软件更新出现缺陷时,这些措施进一步加剧了问题的严重性。
  • 谷歌母公司Alphabet计划230亿美元收购网络安全公司Wiz 通过收购Wiz,Alphabet将能够显著增强其在云计算市场的竞争力。Wiz的全方位云业务对于拥有大量计算资源的大型公司来说非常有吸引力,这有助于Alphabet在这一领域进一步巩固其市场地位。
  • AI时代,“基于模型的设计”理念如何改变数字化进程 “基于模型的设计”就是要先将算法模型化、物理建模模型化,以及环境模型化,然后基于MATLAB与Simulink平台,在后续的设计中不断进行仿真,再用自动代码生成工具产生实际系统所需的软件代码。
  • 全球折叠屏手机快速增长,中国品牌压 • 得益于西欧、关键亚洲市场和拉丁美洲市场的增长,以及中国品牌的持续领先,全球折叠屏手机出货量在2024年第二季度同比增长了48%。 • 荣耀凭借其在西欧特别强劲的表现,成为最大的贡献者,成为该地区排名第一的品牌。 • 摩托罗拉的Razr 40系列在北美和拉丁美洲表现良好,为其手机厂商的出货量贡献了三位数的同比增长。 • 我们预计,头部中国手机品牌厂商的不断增加将至少在短期内抑制三星Z6系列在第三季度的发布。
  • AI网络物理层底座: 大算力芯片先进 AI技术的发展极大地推动了对先进封装技术的需求,在高密度,高速度,高带宽这“三高”方面提出了严苛的要求。
  • 奕斯伟计算DPC 2024:发布RISAA(瑞 奕斯伟计算2024首届开发者伙伴大会以“绿色、开放、融合”为主题,从技术创新、产品应用、生态建设等方面,向开发者、行业伙伴等相关方发出开放合作倡议,加速RISC-V在各行各业的深度融合和应用落地,共同推动RISC-V新一代数字基础设施生态创新和产业发展。
  • 重磅发布:Canalys 2024年中国云渠道 2024年 Canalys 中国云计算渠道领导力矩阵冠军厂商分别是:阿里云、华为云和亚马逊云科技(AWS)
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了