广告

Achronix发布AI领域的高速FPGA+架构解决方案

2019-06-03 16:28:56 Challey 阅读:
芯片工艺从过去28纳米、20纳米, 16纳米,14纳米、10纳米、7纳米、5纳米、3纳米,摩尔定律使芯片性能增加速度越来越饱和。芯片的发展趋势是从CPU、GPU到 FPG,最后到ASIC。但是ASIC
广告

人工智能AI不可争议的成为全球的计算增长点,无论是巨头还是各个领域的细分应用,都在AI化,或者AI+IoT,也就是AIoT化,这是一个不可阻挡的趋势。 

芯片工艺从过去28纳米、20纳米, 16纳米,14纳米、10纳米、7纳米、5纳米、3纳米,摩尔定律使芯片性能增加速度越来越饱和。芯片的发展趋势是从CPU、GPU到 FPGA,最后到ASIC。但是ASIC需要的时间与投入成本很大,因此,FPGA成为目前市场上赢得市场先机最好的计算平台产品,特别是在AI/ML应用场景和领域。 

据Semico Research的最新预测,新兴AI应用为FPGA创造的市场增长迅速,未来4年的CAGR将超过38%,到2023年规模达到52亿美元,增长3倍。这一市场增长主要来自云平台数据中心和高性能计算(HPC)应用,但针对这类应用的AI算法很多,而且仍在不断变化中,目前仍没有占据主导地位的AI芯片架构。

00.png

 

为满足人工智能/机器学习(AI/ML)和高带宽数据加速应用日益增长的需求,总部位于美国加利福尼亚州圣克拉拉市的Fabless厂商Achronix发布了一种高度优化的全新架构:FPGA+,该架构拥有ASIC一样的性能,兼具FPGA的灵活性和增强功能,远远超越了传统FPGA解决方案。

FPGA+.jpg

Speedster7t FPGA系列产品是专为高带宽应用进行设计,具有一个革命性的全新二维片上网络(2D NoC),以及一个高密度全新机器学习处理器(MLP)模块阵列。通过将FPGA的可编程性与ASIC的布线结构和计算引擎完美地结合在一起,Speedster7t系列产品创造了一类全新的“FPGA +”技术。

“我们正处于智能化、自学习计算的高增长阶段的早期,这种计算将广泛影响我们的常生活。”Achronix Semiconductor总裁兼首席执行官Robert Blake表示:“Speedster7t是Achronix历史上最令人激动的发布,代表了建立在四个架构代系的硬件和软件开发基础上的创新和积淀,以及与我们领先客户之间的密切合作。Speedster7t是灵活的FPGA技术与ASIC核心效率的融合,从而提供了一个全新的‘FPGA+’芯片品类,它们可以将高性能技术的极限大大提升。”

FPGA+2.jpg

在开发Speedster7t系列FPGA的产品过程中,Achronix的工程团队完全重构了整个FPGA架构,以平衡片上处理、互连和外部输入输出接口(I / O),以实现数据密集型应用吞吐量的最大化,这些应用场景可见于那些基于边缘和基于服务器的AI / ML应用、网络处理和存储。 

Speedster7t器件采用了TSMC的7nm FinFET工艺制造,是专为接收来自多个高速来源的大量数据而设计,同时还需要将那些数据分发到可编程片上算法性和处理性单元中,然后以尽可能低的延迟来提供那些结果。Speedster7t系列产品包括高带宽GDDR6接口、400G以太网端口和PCI Express Gen5等接口,所有这一切单元都互相连接以提供ASIC级带宽,同时保留FPGA的完全可编程性。

“Achronix全新的Speedster7t FPGA系列产品是创新性芯片架构实现爆发的一个卓越案例,创造该架构的目的是直接面向AI应用处理大量的数据,” Semico Research公司ASIC和SoC首席市场分析师Rich Wawrzyniak说道。“通过将数学函数、存储器和可编程性整合到其机器学习处理器中,再结合交叉芯片、二维NoC结构,从而形成了消除瓶颈和确保整个器件中数据自由流动的绝佳方法。在AI / ML应用中,内存带宽就是一切,Achronix的Speedster7t在这一领域提供了令人印象深刻的性能指标。”

为计算性能进行了高度的优化

Speedster7t FPGA的核心是其全新机器学习处理器(MLP)中大规模的可编程计算单元平行阵列,它们可提供业界最高的、基于FPGA的计算密度。MLP是高度可配置的、计算密集型的单元模块,可支持4到24位的整点格式和高效的浮点模式,包括对TensorFlow的16位格式的支持,以及可使每个MLP的计算引擎加倍的增压块浮点格式的直接支持。

MLP与嵌入式存储器模块紧密相邻,通过消除传统设计中与FPGA布线相关的延迟,来确保以750 MHz的最高性能将数据传送到MLP。这种高密度计算和高性能数据传输的结合使得处理器逻辑阵列能够提供基于FPGA的最高可用计算能力以每秒万亿次运算数量为单位(TOPS,Tera-Operations Per Second)。

世界级的带宽

高性能计算和机器学习系统的关键之处是高片外存储器带宽,从而为多个数据流提供存储源和缓冲。 Speedster7t器件是唯一支持GDDR6存储器的FPGA,该类存储器是具有最高带宽的外部存储器件。每个GDDR6存储控制器都能够支持512 Gbps的带宽,Speedster7t器件中有多达8个GDDR6控制器,可以支持4 Tbps的GDDR6累加带宽,并且以很小的成本就可提供与基于HBM的FPGA等效存储带宽。

 “美光(Micron)乐于携手Achronix去实现全球第一个面向高带宽存储需求而直接加载了GDDR6的FPGA产品,”美光计算与联网业务部营销副总裁Mal Humphrey。“像这样的创新的和可扩展的解决方案将推动人工智能领域内的差异化,其中异构计算可选方案与高性能的存储是加速获得数据内涵的必需部分。”

除了这种非凡的存储带宽,Speedster7t器件还包括业界最高性能的接口端口,以支持极高带宽的数据流。Speedster7t器件拥有多达72个业界最高性能的SerDes,可以达到1到112 Gbps的速度。还有带有前向纠错(FEC)的硬件400G以太网MAC,支持4x 100G和8x 50G的配置,以及每个控制器有8个或16个通道的硬件PCI Express Gen5控制器。

超高效率的数据移动

来自Speedster7t高速I / O和存储器端口的数万兆比特数据很容易淹没传统FPGA面向比特位的可编程互连逻辑阵列的路由容量,而Speedster7t架构包含一个可横跨和垂直跨越FPGA逻辑阵列的创新性的、高带宽的二维片上网络(NOC),它们连接到所有FPGA的高速数据和存储器接口。它们就像叠加在FPGA互连这个城市街道系统上的空中高速公路网络一样,Speedster7t的NoC支持片上处理引擎之间所需的高带宽通信。NoC中的每一行或每一列都可作为两个256位实现,单向的、行业标准的AXI通道,工作频率为2Ghz,同时可为每个方向提供512 Gbps的数据流量。

通过在Speedster中实现专用二维 NoC, 极大地简化了高速数据移动,并确保数据流可以轻松地定向到整个FPGA结构中的任何自定义处理引擎。最重要的是,NOC消除了传统FPGA使用可编程路由和逻辑查找表资源在整个FPGA中移动数据流中出现的拥塞和性能瓶颈。这种高性能网络不仅可以提高Speedster7t FPGA的总带宽容量,还可以在降低功耗的同时提高有效LUT容量。

针对安全性至上和硬件确保应用的安全防护功能

Speedster7t FPGA系列产品在面临第三方攻击的威胁时,可用最先进的比特流安全保护功能应对,它们具有的多层防御能力可保护比特流的保密性和完整性。密钥是基于防篡改物理不可克隆技术(PUF)进行加密,比特流由256位的AES-GCM加密算法进行加密和验证。为了防止来自旁侧信道的攻击,比特流被分段,每个数据段使用单独导出的密钥,且解密硬件采用差分功率分析(DPA)计数器措施。 此外,2048位RSA公钥认证协议被用来激活解密和认证硬件。用户可以确信的是当他们加载其安全比特流时,它是预期的配置,这是因为它已通过RSA公钥、AES-GCM私钥和CRC校验进行了身份验证。

经验证的、可向低成本ASIC转换的途径,用以满足大批量需求

Achronix是唯一一家既提供独立FPGA芯片又提供Speedcore™嵌入式FPGA(eFPGA)半导体知识产权( IP)的公司。Achronix在Speedcore eFPGA IP中采用了与Speedster7t FPGA中使用的同一种技术,可支持从Speedster7t FPGA到ASIC的无缝转换。FPGA应用通常具有必须保持可编程性的功能,而其他固定功能则是专用于特定的系统应用。对于ASIC的转换而言,固定功能可以被固化进ASIC结构中,从而减小芯片面积、成本和功耗。当使用Speedcore eFPGA IP将Speedster7t FPGA转换为ASIC时,客户有望节省高达50%的功耗并降低90%的成本。

关于FPGA+架构产品Speedster7t的的更细技术资料可以扫描下方二维码加入AI机器人官方群获得(一周有效)

AI机器人官方群.jpg

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
Challey
资深产业分析师
  • 技术加持路科V3X助你开启职场新篇章!秋季班持续报名中,大额优惠等你来!    如今的行业背景下,大家都在承受或多或少的职场压力,陷入“互卷”的漩涡难以抽身,诚然想要一点都不卷是不现实的,但不能盲目为了卷而卷。那么如何高效“卷”,如何快速成长,如何事半功倍,我想V3X可以给
  • 剖解企业AI大模型建设路径,提升未来核心竞争力 AI大模型时代的到来,让很多企业都感受到了技术发展的魅力,但由于当前大环境,越来越多的企业对于IT的投入会更加谨慎,而根据过往经验,企业落地AI大模型确实会遇到一些问题,本文主要从大模型的建设路径与2
  • 【CAN总线知识】如何接好CAN的“地” 工业现场CAN环境复杂多变,工程师面对信号的杂、乱、差却是束手无策,追根溯源对于信号的各种地你接对了吗?CAN总线以其高可靠性、实时性、灵活性以及严谨的数据处理机制等特点,在工业现场和汽车行业得到广泛
  • 不容错过的半导体盛会!30+论坛200+演讲嘉宾1000+展商亮相 第12届中国电子专用设备工业协会半导体设备年会、第12届半导体设备与核心部件展示会 将于9月25日-27日在无锡太湖国际博览中心举行。大会将开展包括展览展示、主旨论坛、专题论坛、圆桌对话、产业上下游对
  • 突发!宁德时代一工厂停产! 点击上面↑“电动知家”关注,记得加☆“星标”!电动知家消息,9月11日,瑞银Sky Han等发布的研报《中国锂价见底》称,据内部消息,宁德时代已在9月10日决定暂停其在江西的锂云母业务。9月11日,据
  • 白露为霜 白露为霜唐·颜粲悲秋将岁晚,繁露已成霜。遍渚芦先白,沾篱菊自黄。应钟鸣远寺,拥雁度三湘。气逼襦衣薄,寒侵宵梦长。满庭添月色,拂水敛荷香。独念蓬门下,穷年在一方。
  • 全球首款12英寸功率氮化镓晶圆问世! 9月11日,英飞凌宣布,公司已成功开发出全球首款12英寸(300mm)功率氮化镓(GaN)晶圆。source:英飞凌英飞凌表示,公司是全球首家在现有可扩展的大批量生产环境中掌握这一突破性技术的公司。这
  • 【限时福利】电子工程师的宝藏电子书库开放领取! 末尾免费领取亲爱的电子工程师们,是不是在寻找提升技能的资源?我们为您精心准备了一系列专业电子书,涵盖:EMC(电磁兼容):深入理解电磁干扰的控制与合规。仿真技术:掌握前沿仿真工具,优化电路设计。信号完
  • 活动倒计时1天!谈谈智能座舱与智能驾驶现状与挑战 在汽车消费者个性化、舒适化和智能化需求推动下,以及人工智能、数字化等新技术与汽车结合的大背景下,汽车AI智能座舱与智能驾驶技术迎来了新的技术革新,但AI座舱和智能驾驶技术在快速发展的同时,也面临着一系
  • 相约10月,首届湾芯展“十大看点”抢先看! 在深圳市政府指导和深圳市发展改革委支持下,深圳市半导体与集成电路产业联盟携手深圳市重大产业投资集团有限公司共同主办的首届“SEMiBAY湾芯展”——湾区半导体产业生态博览会,将于今年10月16日至18
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了