在FPGA市场,Xilinx和Intel是两家主导厂商,几乎占据HPC和数据中心的全部市场,留给其它FPGA厂商的机会很小。然而,有一家位于硅谷的小公司Achronix却跃跃欲试,想凭借突破性的FPGA技术和独特的产品策略抢夺这一市场的更多份额,他们有赢得市场和客户的机会吗?
据Semico Research的最新预测,新兴AI应用为FPGA创造的市场增长迅速,未来5年的CAGR将超过38%,到2023年规模达到52亿美元。这一市场增长主要来自云平台数据中心和高性能计算(HPC)应用,但针对这类应用的AI算法很多,而且仍在不断变化中,目前仍没有占据主导地位的AI芯片架构,GPU、CPU和FPGA都有机会。
图1:Semico对AI应用为FPGA创造的市场规模预测
 
在FPGA市场,Xilinx和Intel是两家主导厂商,几乎占据HPC和数据中心的全部市场,留给其它FPGA厂商的机会很小。然而,有一家位于硅谷的小公司Achronix却跃跃欲试,想凭借突破性的FPGA技术和独特的产品策略抢夺这一市场的更多份额,他们有赢得市场和客户的机会吗?
 
Intel虽然在数据中心和HPC市场霸占着压倒性的龙头地位,但在新兴的AI应用上,传统通用CPU正逐渐失去优势,英伟达的GPU一跃成为这一新兴市场的宠儿。微软和亚马逊在FPGA上的投入也为FPGA行业注入了新的活力。尽管Intel有着最为完整的产品线,但收购Altera以来却一直没有明确FPGA的战略地位和价值。收购Mobileye决定了其FPGA在汽车市场已经没有发挥空间,最近发布的Agilex平台似乎希望将FPGA纳入其针对高端市场的整体方案的一部分,但能够发挥多大的价值还有待观察。
 
反观Xilinx在新兴的AI应用上做得有声有色,相对弱小的私营公司Achronix在强敌目前能否站稳脚跟?在最近举行的新闻发布会上,其CEO Robert Blake蛮有信心地表示,客户需要更多选择,Achronix有能力凭借其创新的FPGA+创新技术赢得客户青睐。对于FPGA,新兴AI应用要求芯片不但具有传统FPGA的灵活适应性,而且要有ASIC的性能,要同时在算力、数据传输、存储器层级和接口等方面达到最佳的能效比。如果还是按照传统的FPGA逻辑思路来设计,芯片尺寸、面积和性能将难以满足HPC和数据中心对AI推理的要求。
 
 
 
图2:新的FPGA架构要兼具传统FPGA的灵活适应性和ASIC的性能
 
芯片内部各功能模块之间的数据传输现在成了芯片性能提高的瓶颈。异构计算虽然是处理器发展趋势,但将不同架构的模块塞进一个芯片里并不能解决所有问题,相互间的数据传输和互联接口会导致延迟而影响性能,因此同构计算的架构仍有独特的优势。Achronix最新发布的Speedster7t芯片从三个方面对传统FPGA进行了彻底改造,从而满足高性能计算、高速内部数据传输,以及高速储存访问和接口的要求。

机器学习处理器(MLP):专为AI/ML性能而优化的数学运算模块

带有DSP引擎的传统FPGA是针对无线滤波等复杂应用而设计的,需要高精度和浮点数字格式,但在处理AI/ML应用时效率比较低,需要消耗额外的逻辑和存储器资源,受限于FPGA路由布线,其性能难以达到AI算法的要求。而专为AI/ML性能而优化的数学运算模块MLP则具有高密度倍乘器阵列,同时支持浮点MAC和整数MAC,而且与存储器块紧密耦合。MLP可以支持FP16、FP24、Block Float 17/12,以及16/8/4位整数运算。
图3:机器学习处理器(MLP)带片上存储并支持多种数学运算格式

GDDR6:高速存储带宽和接口

处理器与片外存储器之间的数据存取已经成为高性能计算和机器学习系统的瓶颈,目前的高速储存标准有HBM和GDDR6。HBM成本比较高,Speedster7t选择支持GDDR6,可以降低成本约50%。每个GDDR6控制器可以支持512Gbps带宽,8个GDDR6的总带宽高达4Tbps。
 
图4:新型FPGA架构的高速存储带宽和通信接口
 
除GDDR6外,Speedster7t还支持DDR4/5以满足大容量存储要求。在高速接口方面,Speedster7t可以支持1-120Gbps SerDes,具有固化的400Gbps以太网接口,以及固化的PCIe Gen 5接口。

片上网络(NoC):堪比城市立交和高架交通网络

 如果一个芯片类似于一个拥挤的城市,那么片上网络(NoC)相当于这个城市的高架立体交通网络。一辆车要从城市的A点到达B点,走高架立交高速路可以快速达到,而走地面线路则要花费很长时间。同样的道理,在传统FPGA设计中,每增加一个加速器和接口所占用的面积都要以平方激增,相当于按照传统的地面线路规划行走。而有了NoC,增加一个加速器和接口所占用的面积只是线性增加。因为每个加速器都带有一个网络访问节点(NAP),在NoC的水平行和垂直列交叉处都有一个主NAP和一个从NAP,让数据传输速率达到512Gbps,总带宽可以达到20Tbps。
图5:新型FPGA架构的NoC立体网络
 
此外,数据可以从PCIe接口直接预存到存储器,而不需要占用任何FPGA逻辑资源。例如,要进行400Gbps以太网传输,传统FPGA需要1024位的总线大小,最大频率要724MHz,这对传统PFGA来说是难以达到的。而带NoC和NAP加速器的FPGA则可以分为4个100Gbps,只需要256位和506MHz即可实现。这种固化的ASIC NOC架构具有可编程灵活性,可通过NAP连接FPGA逻辑功能块。
 
Speedster7t FPGA运行机器学习网络的初步仿真测试结果还是比较引人注目的,在ResNet 50上可以达到8600个图像/秒的性能,在Yolov2上可以达到1600,但真实性能还是要等MLperf测试结果出来才能确定。
 
除了以上展示的三项技术创新外,Achronix在产品规划策略上也跟Xilinx和Intel/Altera等FPGA厂商不同,这或许是小公司在高度竞争的市场上寻求生存和发展的独特模式吧。对于新发布的FPGA技术,Achronix不但销售Speedster7t FPGA芯片,还对外授权Speedcore eFPGA IP。
图6:eFPGA IP可以嵌入SoC设计
 
实际上,根据IPNest专门针对全球芯片设计IP的市场统计,2018年增长最快的IP供应商就是Achronix,相对于2017年IP销售额增长了2.5倍,达到5200万美元。Blake先生向《电子工程专辑》透露说,从超大型云计算平台客户那里得到的信息是,他们对单一架构的FPGA很有兴趣。微软和亚马逊的云平台都对FPGA投入了很多资源,也在尝试开发自己的AI推理芯片,Achronix的eFPGA IP对这些客户应该有很大的吸引力,因为市场上的同类选择并不多。此外,一旦针对某一特定应用的FPGA确信可以达到所期望的性能,他们会考虑快速转向ASIC以降低成本和大规模部署,这时候eFPGA IP就可以发挥更大价值。

结语

以往芯片设计师在FPGA的灵活性和ASIC的性能及成本方面总是难以兼得,但现在新兴的AI/机器学习应用要求芯片供应商同时做到可编程灵活性和高性能,这需要跟传统FPGA截然不同的设计思维才能达到这一标准。Achronix的Speedster7t FPGA芯片和Speedcore eFPGA IP是一个新的尝试,能否在HPC和数据中心市场站得住脚还要看其现实环境下的性能表现。

相关阅读:利用本性、借力培育打造令人惊叹的AI SoC 

 

本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
以市值860亿美元计算,英特尔已跌出全球十大芯片制造商之列。它是今年费城芯片指数中表现第二差的公司……
《纽约时报》近日报道称,尽管美国对俄罗斯实施了严格的芯片出口限制,但俄罗斯仍在其导弹系统中大量使用来自 AMD、德州仪器、美光和英特尔等美国公司的芯片。
AMD官宣AMD 总裁 Victor Peng即将退休,将于 2024 年 8 月 30 日退休。在此期间,Victor Peng继续担任 AMD 执行团队的顾问,并支持过渡,直至退休。
近日有外媒报道称,头字节跳动与美国博通达成合作,共同研发先进的5纳米定制化AI芯片。6月24日晚间,字节跳动对问询媒体表示,该消息不实。
与前代产品AMD Alveo U55C计算加速卡相比,Alveo V80的逻辑密度至高翻倍、存储器带宽至高翻倍,且网络带宽可高至4倍,可以实现强大的计算集群,也不再需要DDR4或其他外部芯片,从而优化了卡、服务器数量以及机架空间。
世界半导体贸易统计组织(WSTS)的最新预测,2024年全球半导体市场预计将实现16%的增长,市场估值达到6110亿美元。这一增长主要得益于过去两个季度的强劲表现,尤其是在计算终端市场。
• 得益于西欧、关键亚洲市场和拉丁美洲市场的增长,以及中国品牌的持续领先,全球折叠屏手机出货量在2024年第二季度同比增长了48%。 • 荣耀凭借其在西欧特别强劲的表现,成为最大的贡献者,成为该地区排名第一的品牌。 • 摩托罗拉的Razr 40系列在北美和拉丁美洲表现良好,为其手机厂商的出货量贡献了三位数的同比增长。 • 我们预计,头部中国手机品牌厂商的不断增加将至少在短期内抑制三星Z6系列在第三季度的发布。
AI技术的发展极大地推动了对先进封装技术的需求,在高密度,高速度,高带宽这“三高”方面提出了严苛的要求。
奕斯伟计算2024首届开发者伙伴大会以“绿色、开放、融合”为主题,从技术创新、产品应用、生态建设等方面,向开发者、行业伙伴等相关方发出开放合作倡议,加速RISC-V在各行各业的深度融合和应用落地,共同推动RISC-V新一代数字基础设施生态创新和产业发展。
2024年 Canalys 中国云计算渠道领导力矩阵冠军厂商分别是:阿里云、华为云和亚马逊云科技(AWS)
文|萝吉今年下半年开始,国内新能源市场正式跨过50%历史性节点,且份额依然在快速增长——7月渗透率破50%,8月份破55%……在这一片勃勃生机万物竞发的景象下,新能源市场占比最高的纯电车型,却在下半年
‍‍Mobileye 将终止内部激光雷达开发Mobileye 宣布终止用于自动驾驶的激光雷达的开发,并裁员 100 人。Mobileye 认为,下一代 FMCW 激光雷达对可脱眼的自动驾驶来说必要性没
会议预告向世界展示中国最具创新力、领导力和品牌化的产品与技术!9月27号,“第6届国际移动机器人集成应用大会暨复合机器人峰会”将在上海举行,敬请关注!再度出现,能否再次“出线”?文|覃洁兰近日,曾经在
在德国柏林举行的IFA 2024上,AMD计算和图形业务集团高级副总裁兼总经理Jack Huynh宣布,公司将把以消费者为中心的RDNA和以数据中心为中心CDNA架构统一为UDNA架构,这将为公司更有
疫情后的劳动力囤积和强有力的员工保护规则掩盖了德国高薪制造业工作市场令人担忧的变化。根据联邦劳工办公室的数据,欧元区最大经济体德国的失业率在2019年春季曾达到历史最低点4.9%,现已上升至6%。虽然
展位信息深圳跨境电商展览会(CCBEC)时间:2024年9月11-13日 9:30-17:30地点:深圳国际会展中心(宝安)展馆:16号馆 16D73/16D75 展位报名注册准备好“观众注册”入场二
9月6日,“智进AI•网易数智创新企业大会”在秦皇岛正式举行,300+企业高管及代表、数字化技术专家齐聚一堂,探讨当AI从技术探索迈入实际应用,如何成为推动组织无限进化的新引擎。爱分析创始人兼CEO金
近日,3个电驱动项目迎来最新进展,包括项目量产下线、投产、完成试验等,详情请看:[关注“行家说动力总成”,快速掌握产业最新动态]青山工业:大功率电驱项目下线9月5日,据“把动力传递到每一处”消息,重庆