广告

英特尔10nm FPGA神秘亮相,和赛灵思早晚必有一战

2017-09-29 10:50:07 邵乐峰 阅读:
在日前举办的“英特尔精尖制造日”上,英特尔率先展示了采用自有10纳米(10nm)制程工艺制造的FPGA产品(代号为“Falcon Mesa”),它们未来将被用于……
广告

根据英特尔提供的数据,2020年,每位互联网用户每天要消耗1.5GB的数据流量;自动驾驶汽车每天要产生4TB的数据;联网的飞机每天要产生5TB的数据;智能工厂每天要产生1PB的数据;云视频提供商平均每天提供750PB视频。由此而来的是,“大数据”时代需要更快捷、高效的计算方式和加速方式。

在云上部署FPGA加速

在云服务器和云计算中实现加速是FPGA的使命之一。微软不久前在2017年高效能芯片大会(Hot Chips 2017)上宣布选择英特尔Stratix 10 FPGA作为其新的深度学习加速平台(代号为Project Brainwave)的关键硬件加速器,通过英特尔Stratix 10 FPGA和至强处理器,Project Brainwave平台在单个请求上实现了超过每秒39万亿次浮点运算的性能。

英特尔可编程解决方案事业部FPGA软件解决方案高级总监Bernhard Friebe在谈到此次合作时表示,微软是第一家在其公有云基础设施中部署FPGA的大型云服务提供商。他们清晰的意识到,在云中,系统需要处理直播数据流(包括视频,传感器或搜索查询)并快速将数据传送回用户,因此提供实时人工智能变得越来越重要。而这种基于FPGA的深度学习加速平台可以提供“实时人工智能”技术,使云基础设施能够以超低延迟来尽可能快速地处理和传输数据。

京东与英特尔联合创新实验室基于FPGA的深度学习线上服务,用于处理图像内容感知等应用,则是另一个典型合作案例。资料显示,来自京东AI与大数据部的研发团队通过Arria 10 FPGA,实现了卷积神经网络(CNN)和长短时记忆神经网络(LSTM),不仅适合京东私有云上的图像处理,还可帮助接入京东云服务的用户使用深度学习线上服务。

图像内容感知识别技术在京东有着广泛的应用场景,其中京东的光学字符识别(Optical Character Recognition, OCR)系统基于CNN+LSTM网络实现了端到端的文字识别,这项技术用于京东敏感词审核、商品描述提取以及用户实名认证等诸多环节。京东集团副总裁,AI与大数据部负责人翁志指出,虽然目前京东的商品详情图上敏感词审核已有95%以上的准确率和90%以上的召回率,但在某些场景中,图片内容的复杂性使得在现有GPU上进行的计算处理会存在延时。而经过测试, Arria 10 FPGA上实现的LSTM加速卡相比GPU在性能上提升了近5倍,避免了一些无用计算,降低了图片的识别延时。
20170929-FPGA-1
除了与微软、京东的合作外,Bernhard Friebe还列举了英特尔FPGA其它的应用案例,包括SWARM64通过FPGA加速,实时数据分析速度可提高5倍以上,传统数据仓储提高2倍以上,存储压缩提高3倍以上。此外,ATTALA的存储器则是利用FPGA加速降低了57-72%的数据延迟。
20170929-FPGA-2

下一代10nm FPGA

Bernhard Friebe认为,CPU+FPGA异构计算是异构结构的第三阶段,相对于专业加速器ASSP/ASIC和CPU+GPU异构计算,CPU+FPGA在加速速度和加速方式上取得了突破。FPGA异构结构具有很高的灵活性,可以面向网络、存储和计算领域中定向和变化的工作负载。FPGA灵活、原生并行、高性能、高能效、可重复编程、低延迟的特点在异构结构中得到充分体现。
20170929-FPGA-3

FPGA在异构计算中具体有两种加速形式,即旁路加速和内建加速。旁路加速可以将重度计算功能转移到FPGA上,从而释放处理器去处理其他功能;而如果时延比较重要,则可以进行内建加速,从而通过FPGA的多功能性带来更好的网络存储和计算的加速。另外,英特尔FPGA产品在数据库加速、基因测序、存储及云端已经有具体的应用,并且达到了很好的效果。

而在日前举办的“英特尔精尖制造日”上,英特尔率先展示了采用自有10纳米(10nm)制程工艺制造的FPGA产品(代号为“Falcon Mesa”),它们未来将被用于满足数据中心、5G、网络功能虚拟化(NFV)、汽车、工业和军事/航天的加速和计算需求。

Falcon Mesa FPGA产品家族将支持112Gbps串行收发器链路和包括PCI Express Gen4x16在内的最新外围设备互联,可面向下一代数据中心提供高达每通道16GT/秒的数据传输率。此外,还将支持多项英特尔最新技术,包括Embedded Multi-Die Interconnect Bridge(EMIB)封装技术、高带宽内存(HBM)和英特尔HyperFlex架构。

20170929-FPGA-4
在提供硬件产品的同时,英特尔还通过最新的加速堆栈产品帮助客户降低开发的门槛,更轻松的实现公有云和私有云的无缝软件迁移。FPGA让“云”的应用有了明显的分层:机架级及云编排、用户应用、行业标准软件框架、加速库、开发者工具、包含OPAE在内的加速环境以及硬件设备。开发人员可以利用云编排软件进行应用程序开发,也可以选择服务商提供的模块化功能。
20170929-FPGA-5
本文为《电子工程专辑》原创,版权所有,转载请注明出处并附链接

EETC wechat barcode


关注最前沿的电子设计资讯,请关注“电子工程专辑微信公众号”。

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
邵乐峰
ASPENCORE 中国区首席分析师。
  • 传台积电将在台湾再建两座CoWoS先进封装厂 台积电计划在 3 月前投资超过 2000 亿新台币(约合 61.2 亿美元),扩建其位于台湾南部科学园区三期的CoWoS生产设施。知情人士透露,台积电之所以做出这一决定,是因为人工智能(AI)驱动的先进封装需求比预期更为强劲......
  • 索尼新专利:利用AI技术解决游戏延迟问题 索尼新专利利用人工智能(AI)技术来预测玩家的操作输入,从而显著减少在线游戏中常见的延迟问题。这项创新技术被称为“定时输入/动作释放”,通过智能AI模型提前判断玩家的意图,并在实际操作完成之前执行相应的指令,从而提升游戏的流畅度和响应速度......
  • 将人工智能应用于射频设计 人类的发明,即工程系统,依赖于物理学和数学基本原理,如麦克斯韦方程、量子力学和信息论等,以实现特定目标。然而,随着工程系统复杂性和规模迅速增长,其子组件的功能可能呈现出非线性特性,这使得基于第一原理的设计方法受到限制。
  • 2025年全球将启动18个新的晶圆厂项目建设,中国有5个 半导体行业正迎来一个新的建设高峰期,SEMI预测,2025年,全球范围内将有18个新的晶圆厂项目开始建设,其中15座为12英寸晶圆厂,3座为8英寸晶圆厂,大部分预计将于 2026 年至 2027 年开始运营......
  • TCL正式发布“世界上第一款模块化人工智能伴侣机器人” 这款机器人头上的摄像头可以录制视频或使用人工智能识别物体,虽然该机器人的动作仅限于挥动细小的手臂和眨动动画眼睛,但它可以与一把小型电动椅子配对,自动在家中导航。
  • 迎接硅光子时代:开启超高速数据传输新篇章 随着AI和量子计算等前沿领域的快速发展,GlobalFoundries、Tower Semiconductor以及多家公司正积极迎接硅光子技术带来的新机遇。这项新兴技术有望为二线代工厂带来竞争优势,并推动全球芯片制造技术的多样化发展。
  • 2025年中国PC显示器市场十大洞察 对于未来行业发展的增长趋势、行业特征和渠道特点等方面,IDC 总结并给出了2025年中国PC 显示器市场十大洞察……
  • 中科院微电子所在SRAM存内计算领域 该存内计算芯片采用全数字设计,能够保证不同位宽配置下的精确计算。为实现不同位宽配置下的高利用率和高能效,团队提出了一种……
  • 西门子获评IDC MarketScape制造执 西门子数字化工业软件在IDC MarketScape发布的《2024 – 2025全球制造执行系统供应商报告》中被评为MES领导厂商,该报告针对制造业的MES软件厂商进行了综合性评估。
  • Arm发布芯粒系统架构首个公开规范, Arm宣布其芯粒系统架构 (CSA) 正式推出首个公开规范,进一步推动芯粒技术的标准化,并减少行业的碎片化。
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了