2019年4月10日, Flex Logix Technologies, Inc. 宣布,其在拥有数个专利的业界领先的eFPGA互连技术上,结合专为AI推理运算而优化的nnMAXtm乘加器(MAC), 研发了 InferXtm X1边缘推理芯片。

2019年4月10日, Flex Logix Technologies, Inc.  宣布,其在拥有数个专利的业界领先的eFPGA互连技术上,结合专为AI推理运算而优化的nnMAXtm乘加器(MAC), 研发了 InferXtm X1边缘推理芯片。今天在美国硅谷举办的Linley Processor Conference,Flex Logix介绍了 InferX X1芯片及其性能。作为一款针对于边缘AI推理应用的芯片,InferX X1有着极高的 MAC 利用率以及出众的能效比 — 只需要一颗x32的DRAM, 就可以达到8TOPS的算力。这在边缘推理这种只需 low batch size 的应用场景中显得极为重要。与现有的解决方案相比,InferX X1能以更低的功耗,更低的成本,提供更高的算力。


InferX X1可以支持语音,图像,视频等任何基于TensorFlow-Lite或ONNX的模型和算法,特别适用于大型的模型算法和实时识别。例如YOLOv3实时物体识别算法,InferX X1在batch=1的情况下,可以对1Megapixel图像 达到25.4帧每秒(fps)的吞吐量。对2Megapixel高清图像达到12.7帧每秒(fps)。而达到这样的高吞吐量只需要用到一个x32的DRAM。

InferX 支持INT8,INT16,BF16并可以在不同的算法层混合使用,方便客户根据自己的需求来优化吞吐量和算法精度。InferX还内置有Winograd变换来加速INT8计算卷积,芯片会自动对适用的矩阵乘法来实时转换weights到Winograd模式,得到将近2.25倍的性能提升。由于InferX的Winograd是用12bits来计算的,所以精度不会有损失。

Flex Logix提供客户完整的软件开发环境。客户可以直接将基于TensorFlow-Lite或ONNX的算法直接用Flex Logix的nnMAX Compiler软件来编译。

Flex Logix将提供InferX X1芯片。芯片可以通过扩展口来连接数个芯片以增加算力。Flex Logix同时还会提供搭载InferX X1的半高半长PCIe卡给Edge Server和gateway客户。

“设计边缘神经网络推理芯片的一个难题是如何降低大量的数据交换及降低功耗,而我们的可编程互连技术是接近完美的解决方案。”Flex Logix CEO Geoff Tate说。”在运算一层网络的时候,我们利用可编程互连将InferX的MAC根据这一层网络的dataflow来连接,等于是专为这一层运算配置了一个ASIC。同时对下一层网进行络pre-load,以实现在这一层运算完后可以最快速地配置下一层。同样的可编程互连也与片上的SRAM连接,将这一层的输出,快速配置成下一层的输入,从而避免了大量的数据交换。所以InferX只需要一颗x32 DRAM就够了。这让我们可以将芯片设计得更小,大大降低了功耗和成本。”

Geoff Tate还说, “我们还在芯片里加上了Winograd来加速INT8的运算,这让客户在选择INT8时能得到更高的吞吐量。而同时我们也支持BF16,让对精度更在意的客户在需要时也能运用。客户可以选择根据自己的需求在不同的网络层混合运用来到达高精度,高吞吐量。”

一个创新的可编程互连技术,两个高速成长的产品线

Flex Logix在其拥有十余个专利的创新可编程互连技术上研发了EFLX eFPGA IP. Flex Logix已经成为eFPGA IP市场的领先者,已有包括大唐辰芯,美国波音,SiFive RISC-V等十余个客户正在应用Flex Logix的eFPGA IP。

最新研发的nnMAX AI IP,即InferX芯片中使用的新推理架构,利用了同样的可编程互连技术,并结合了专为AI推理而设计的乘加器(MAC)和存储单元。这些乘加器能支持INT8, INT16, BF16等AI算法里常见的精度数字。每一颗nnMAX IP单元拥有1024个乘加器以及相应的SRAM,在16nm制程上可以提供2 TOPS的算力。nnmAX IP单元可以根据需求拼接成NxN的阵列,最大可以提供超过100 TOPS的算力。

Flex Logix在InferX X1芯片里集成了4个nnMAX IP单元,提供8 TOPS的算力。

时间表

InferX X1推理芯片计划于Q3 2019流片,样片和PCIe板可于年底提供。基于台积电16nm的nnMAX IP将于Q3 2019提供授权给客户用于集成到客户自己的ASIC或SoC. 感兴趣的客户可以访问 www.flex-logix.com 来获得我们在 Linley Processor Conference发布的胶片,或联系Flex Logix亚太区销售jim@flex-logix以获取更多信息。

阅读全文,请先
您可能感兴趣
IP供应商、芯片设计服务提供商和AI专家在以AI为中心的设计价值链中的地位正变得更加突出。本文给出了四个设计用例,强调了服务于AI应用的芯片设计模型的重新调整。
频率梳是一种能够发射多条等间隔频谱线的特殊激光源,广泛应用于光学钟、激光雷达、光谱学和光神经网络等高精度测量领域……
据台湾工商时报报道,英伟达(Nvidia)已正式成立ASIC(应用特定集成电路)部门,并计划在中国台湾招募上千名芯片设计、软件开发及AI研发人员。
根据Imagination官方声明,CEO西蒙·贝雷斯福德-怀利先生目前仍然全力投入公司管理工作,并未“被迫辞职”。
通过收购宏晶微电子,康佳集团将能够进一步拓展其在半导体领域的业务版图,提升公司在芯片设计、开发、生产和销售等方面的实力。
紫荆半导体是一家专注于RISC-V车规级芯片设计开发的公司,公司的首颗明星产品——紫荆M100于今年9月成功点亮,并获得了功能安全认证,其采用模块化设计,内核可重构,具备更快的处理速度和更少的耗时……
• 目前,iPhone在翻新市场中是最热门的商品,并将长期主导着翻新机的平均销售价格。 • 全球翻新机市场持续向高端化发展,其平均销售价格(ASP)现已超过新手机。 • 新兴市场是增长的最大驱动力,消费者对高端旗舰产品有着迫切需求。 • 由于市场固化和供应链的一些问题限制推高中国、东南亚和非洲等大市场的价格。 • 2024年,这些翻新机平均销售价格将首次超过新手机。
从全球厂商竞争来看,三季度凭借多个新品发布,石头科技市场份额提升至16.4%,连续两季度排名全球第一……
最新Wi-Fi HaLow片上系统(SoC)为物联网的性能、效率、安全性与多功能性设立新标准,配套USB网关,可轻松实现Wi-Fi HaLow在新建及现有Wi-Fi基础设施中的快速稳健集成
其中包含Wi-Fi 7和蓝牙5.4 模组FME170Q-865、Wi-Fi 6和蓝牙5.4 模组FCS962N-LP、Wi-Fi 6和蓝牙5.3模组FCU865R 、独立Wi-Fi和蓝牙模组FGM840R、高功率Wi-Fi HaLow模组FGH100M-H……
‌‌Jan. 9, 2025 产业洞察根据TrendForce集邦咨询最新研究,随着人型机器人迈向高度系统整合,并有望从工业场景走进家庭生活,前端的AI模型训练将更为关键,以满足更多后端理解与互动需求
据知情人士透露,软银集团及其持有多数股权的Arm正在探索收购Ampere Computing的交易。匿名知情人士表示,甲骨文支持的半导体设计公司Ampere在探索战略选择时引起了Arm的收购兴趣。不过
随着Mini/Micro LED技术发展和小间距产品成熟,LED显示行业在更多细分场景下的高增长潜力正在加速释放。Mini LED背光市场自2021年进入起量元年后,年复合增长率达50%;Micro
‍‍美国拉斯维加斯当地时间1月7日,第58届国际消费类电子产品展(CES2025)在拉斯维加斯开幕。本届展会,TCL华星携涵盖电视、车载、显示器、笔电、平板、手机、VR等显示领域的多款重磅展品亮相,其
亚化咨询重磅推出《中国半导体材料、晶圆厂、封测项目及设备中标、进口数据全家桶》。本数据库月度更新,以EXCEL表格的形式每月发送到客户指定邮箱。中国大陆半导体大硅片项目表(月度更新)中国大陆再生晶圆项
    大联大控股宣布,其旗下世平推出基于安森美(onsemi)NCP5156x芯片的双通道隔离驱动IC评估板方案。    图
近日,闻泰科技在一场电话会议中阐述了其出售ODM(原始设计制造)业务的战略考量。           闻泰科技表示,基于地缘政治环境变化,考虑到 ODM 业务稳健发展和员工未来发展利益最大化,公司对战
1月8日,艾比森、聚灿光电先后发布2024 年度业绩预告。在大环境变动的影响下,两家企业呈现出不同的表现,然而,它们各自的亮点表现都在一定程度上反映了市场需求的变化。如艾比森在海外市场呈良好增长态势,
据彭博社报道,软银集团及其控股子公司 Arm 正在探讨收购 Ampere Computing 的可能。 Ampere Computing 是甲骨文支持的半导体设计公司,致力于塑造云计算的未来,并推出了
日前,奥康国际发布公告表示终止发行股份购买资产。根据公告,2024 年 12 月 24 日,奥康国际披露《关于筹划发行股份购买资产事项的停牌公告》,公司拟筹划以发行股份或支付现金的方式购买联和存储科技