探讨用FPGA实现边缘端侧AI的市场机会及前景——大模型引领大算力硬件的“牛市”正来临!

原创 EETOP 2024-07-03 11:44


随着大模型快速的发展人工智能正在改变嵌入式硬件系统。在今年上海国际嵌入式展的开幕主题报告中,芯原股份董事长兼总裁戴伟民博士分享说:我们即将迎来新一轮的'牛市'上一轮是以2010iphone4为代表的智能手机正式开启移动互联网'牛市'2013-2015)这个时期的特点是先硬后软ChatGPT为代表的大模型将引领大算力硬件的'牛市'这一时期,将是先软后硬。(2026-)


同在今年6月,黄仁勋在COMPUTEX 2024的演讲中也预测,未来AI产业规模将高达100万亿美元,比之前IT时代的3万亿美元要高出33万倍以上。可见市场前景之广阔。




AI处理重心向边缘转移,已经是行业共识。各类端侧AI应用,也已开始竞相布局。中关村智用人工智能研究院孙明俊院长在嵌入式大会开幕式上表示未来三至五年AI会融入到嵌入系统并带来共同的深入改变在快速推进的背景下端侧的需求会更高尤其表现在对端侧芯片处理能力的需求变化以及会出现大量专用端侧芯片的需求


边缘AI一个非常显著的特征就是更强的并行计算能力,以及不断更新的AI算法。而网络边缘设备需要AI解决方案能增强实时在线功能,包括更强的情景感知能力、更高的能效、灵活和低延迟的传感器桥接,以及更低的复杂性和简化的集成。


AI芯片是其中的关键。从技术架构的角度来看,AI芯片可分为GPU、FPGA和ASIC。按网络位置不同,又可分为云端芯片和边缘芯片。按应用目标分类,则又可分为训练芯片和推理芯片。其中,FPGA,因其现场可编辑性的优势,被誉为“万能芯片”。那么,在边缘AI大发展趋势下,FPGA如何来实现AI。


在此次的嵌入式展上,EETOP深度走访了FPGA知名供应商莱迪思(Lattice)科技公司,详细观摩了他们此次参展的产品及相关Demo,并与莱迪思(Lattice)亚太地区应用工程高级总监谢征帆进行了深入交流。对FPGA在端侧的AI实现又有了不少新的发现和认识。

谢征帆,莱迪思(Lattice)亚太地区应用工程高级总监


Sensor Bridging助力NVIDIA加速边缘AI应用开发


去年12月,在莱迪思半导体开发者大会上,莱迪思宣布推出新型参考传感器桥接设计。它是一套开源的参考开发板,基于莱迪思低功耗CertusPro-NX FPGA和NVIDIA Jetson Orin和IGX Orin平台,通过NVIDIA Holoscan传感器桥无缝耦合,进行数据采集和处理。


此次嵌入式展上,莱迪思特别用心的从美国运来了与NVIDIA一起联合开发的demo。据介绍,这个具备Sensor Bridging功能的Demo,主要实现多路Video通过以太网口汇聚到英伟达基于IGX/AGX平台的Edge Computing盒子中,以提供更多的视觉输入。莱迪思提供的FPGA,主要起到聚合的功能。传感器经过FPGA芯片,汇聚成视频流,再转换成实际的以太网,最后进入到盒子里。真正实现AI相关功能的,则交由NVIDIA芯片来进行处理。


AI芯片的原理是通过训练和学习算法,将大量的数据输入到神经网络结构中,并对输入数据进行快速、准确的处理和分析。其中,主要的结构包括输入层、隐藏层和输出层。输入层主要是接收数据,并将其传递到隐藏层,隐藏层会通过神经元之间的连接,将信息传递到输出层,最终输出想要的结果。


那么,FPGA来实现Sensor的融合,有什么优势?其中的难点和挑战又是什么?EETOP就这方面的问题,特别请教了谢征帆。


据他介绍,大部分环境和系统里面,Sensor的数目是不断地增加的。除了高速的Sensor以外,还有可能有高清的摄像头输入,以及红外或者其它低速的Sensor也需要进行汇集。对于SoC来讲,管脚数目是非常大的限制。因为需要连接非常多的外设,它没有办法提供多个Sensor接口来直接把这些Sensor汇聚进芯片里。这就需要用FPGA把不同的数据进行先整合,之后再交由芯片对数据进行处理


Sensor Bridging功能主要是让客户能够拿到更多的视频流,数据汇聚完之后,通过芯片交给GPU进行处理。谢征帆介绍说:“我们在做这个应用的时候,一个比较大的挑战就是它的接口协议种类特别多。这就需要在考虑方案的时候,把所有的接口都处理好。除了前端接收需要考虑接口问题外,在往后端传输视频流的时候,也需要适配不同的接口。除了连接,还需要做预处理,做一些简单的前端ISP处理。具体会根据客户的需要,来提供不同的预处理方案。”


据了解,莱迪思早在五六年前,就开始着眼于FPGA在AI领域的拓展。目前除了软件、硬件外,更强调的是解决方案其中sensAI™是最早提出的主要是基于神经网络来做人脸或者物体检测,属于比较早期的阶段。后来随着神经网络的不断迭代,网络结构也越发复杂,并且随着AI的输入视频源越来多,用GPU来做数据的前期处理,显然有点大材小用。于是莱迪思开始尝试用通用的器件来做AI前端的处理谢征帆特别强调说:“莱迪思的解决方案虽然参与神经网络的处理,但不做training,只做inference。”


据分享,Sensor Bridging旨在满足开发人员在设计用于医疗保健、机器人和嵌入式视觉的高性能边缘AI应用时对连接各种传感器和接口、设计可扩展性和低延迟的需求,可大幅简化并加速需要不同传感器输入接口和协议的智能边缘系统的部署。


计算机视觉注意力感知软件推动AIGC


AI要通过FPGA来实现的话,除了硬件架构,还需要有好的软件环境。在莱迪思提供的sensAI™解决方案中,硬件有最新的Avant FPGA,它能够比 DSP处理更多的数据,并且能够针对8位的数据类型做优化;软件有Neural Network Builder 和 Compiler,可以支持非常多的主流AI 架构和机器学习架构。


PC和AI眼镜是未来边缘端侧的重要载体


在此次展示中,莱迪思通过两台PC电脑,展示了多种基于软件实现的AI功能,如注意力追踪功能、脸部识别功能、疲劳检测功能等。Demo演示中,可通过眼神注视来对PC电脑的菜单进行选择,并且会自动帮忙打开正在注视的文件。谢征帆解说时说:“这完全是基于纯软件的功能,通过观察瞳孔的方向来帮助实现控制,并提供前端的输入,最后交由莱迪思Glance软件提供AI的功能。


通过利用莱迪思sensAI™技术,PC还可以在用户接近或离开时自动开机/关机,警告用户不要围观,并通过在用户分心时调暗屏幕来延长电池寿命 。不过,由于PC受环境影响比较大,精度上有一定干扰。谢征帆介绍:“它属于早期的预演阶段,离真正的产品化还有段距离不过已经有AI眼镜的用户,在尝试用这个来做原型机,实现AI应用。因为AI眼镜局部环境相对固定,不会受背景影响,可以提供非常高的精度。通过眼球来进行选择,可提供更加丰富的控制功能。



AI眼镜,被认为是AIGC时代或将引爆市场的终端设备戴伟民博士在主题演讲中分享了第十三届芯原CEO论坛对大模型未来给出的五大预测,其中一个就是:到2026年,全球双目全彩AR眼镜出货量将突破1,000万台AIGC,即Artificial Intelligence Generated Content生成式人工智能,是人工智能1.0时代进入2.0时代的重要标志,也是终端设备由+AI转向AI+的明显过渡。从2017年6月Google发布论文《Attention is all you need》,首次提出Transformer模型;到2018年6月,OpenAI发布论文《Improving Language Understanding by Generative PreTraining》,首次提出GPT模型;再到2024年2月,OpenAI发布具有突破性的Sora视频生成模型,支持60秒一镜到底。不断迭代创新的算法,多模态大模型都在推动AIGC具备更通用和更强的基础能力。


从计算智能、感知智能再到认知智能,AIGC为人类社会生产力发展带来了质的飞跃。戴伟民博士表示:“始终在线”的轻量化智慧可穿戴设备是AIGC的入口用“始终在线”的轻量级可穿戴设备持续感知视觉、声音和动作等,并连接到系统,通过上下文意识,来预测用户的环境、情境和需求。在莱迪思的展台上,也展示了多个基于感知功能的Demo。



除了AI眼镜,PC被认为是未来AI的主要载体因为PC具有强大的计算和存储能力,丰富的交互方式以及广泛的应用场景,使其成为适合承载大模型的理想平台。戴伟民博士分享说:PC是承载最多场景的个人通用设备,是迄今为止最强的个人计算平台,还是存储容量最大、最受依赖的安全终端,完全具备全模态的人机自然交互能力。


在莱迪思的展台上,EETOP小编也看到了基于莱迪思CrosslinkU-NX (LIFCL-33U)芯片搭建的Demo,它可为PC在Sensor后端提供和AI相关的运用,包括为计算机自动解锁和security保护,同时还包括语音检测、人脸识别、场景分类、防偷窥等传统应用。除了更加丰富的用户体验之外,低功耗也是一大特色。


智能汽车依然是FPGA的重要竞技场


摄像头的输入只是边缘端侧AI实现的一部分对智能汽车的监控,则要涉及到更多处理,比如是不是打瞌睡,有没有分心等,这主要就是DMS疲劳检测的功能。谢征帆介绍说:“我们的软件支持多用户软件检测,并且同样一套网络可以实现多种内容的检测追踪,能够做一些机器学习之后应用场景其实是很多的。


莱迪思最近一两年一直在推广Local Dimming的方案,它是eDisplay解决方案中的一部分。eDisplay就是所谓的Embedded Display,或者叫Enhanced Display,涉及到所有显示相关的应用。本次展示区,莱迪思展示了一个Local Dimming局部调光的demo。


众所周知,LED是由背光板来提供光源的。因此,显示质量的好坏,很大程度上是取决于背光板的亮度。传统的做法是背部有一个统一的光源,由于不能根据每一个区域实际的亮度来进行调整,因此屏幕上颜色亮度的分辨差异是非常大的。通常,背光的精度是用分区数目来定义的。如电视机可能分区就是256个。但是对于高端显示器,比如应用在游戏里面的显示器,或者针对汽车里面用的,汽车的中控屏或者副驾驶的娱乐屏都会在里面放Local Dimming。Local Dimming把屏幕分割成2048或者几K的分区,每个分区的后面都会有一个LED来提供背光的亮度。Local Dimming可以把屏幕分成非常小的分区,并且可以支持任意的异形屏,在汽车里的长条或者有弧度的都可以。


此外,Local Dimming除了应用在显示中,同样的功能可以迁移到不同的应用场合。当前,越来越多的应用领域转换到视频上的管理,以及视频处理方面CMS(Camera Monitor System)方案是这两年汽车领域有很多供应商都开始关注的传统意义上,汽车反光镜是物理的光学反光镜,会有很大的限制,比如说在雨天,会受到雨水的影响,或者在潮湿天气,两边车窗起雾以后会造成影响,会影响驾驶安全。现在越来越多的车厂考虑用摄像头来替代物理的光学反光镜。


那么CMS为什么应用FPGA?谢征帆解说到:“FPGA有几大优势,首先最主要的就是低延时因为反光镜是实时的,从用户感知来说,从视频采集到视频显示,需要做到低延时,如几十毫秒或者更低。如果用MCU或者嵌入式处理器,基本无法达到这个要求。莱迪思的HUD方案则可以提供这样的效果。


FPGA在AI领域的丰富应用


在AI领域,莱迪思有很多的应用。展示区还有一个农业智能机器的Demo,主要是花椒筛选的色选机方案。工作流程大致是当一批固体落下时,要把和花椒的形状一致的东西挑选出来。如果判断不是花椒,则通过气流将其吹掉。传统色选机用的是CV方案,精度相对比较低。新的AI的方案,会对可能存在的形状加标注,之后放到神经网络里进行训练,最后再将训练出来的神经网络参数放到NN Demo里,就可以实现精准的筛选功能。


谢征帆介绍说,目前这个Demo的原型机已经完成设计,其它豆类或谷物类都可以参照类似方法来实现。在工业领域PDM应用中,主要是通过AI引擎判断电机是不是有可能处在早期失效的情况中,可以有效的防患于未然,对整个系统运行的安全性和高可靠性能够提供帮助。其实,只要涉及到和MCU和嵌入式处理器的应用,就都有机会



从全球来讲,莱迪思的优势就在于低功耗和小尺寸在小封装和低功耗方面,展示区展示了一个内窥镜的demo,里面有非常小的Image sensor,主要是做接口转换。从LVDS的接口出来以后,从MIPI的接口到接收板。展示的是早期的demo版,最后产品化会做成非常小的封装,随着内窥镜的探头进入人体内,所以芯片尺寸要求会非常高。另外,到体内以后还有功耗的问题,所以整个是用莱迪思平台的芯片提供低功耗的产品。谢征帆表示:我们和竞争对手相比功耗基本上能降低一半甚至更低,这是从硬件的结构上来讲莱迪思是有这个优势


FPGA的生命力挑战及机会方向


FGPA虽然有“万能芯片”的美誉,但也存在其自身的局限和市场发展的取舍。比如PC更多还是借助CPU来提供AI功能,因为CPU有足够多的算力,可以在这上面做非常丰富的AI处理。而FPGA的先发优势是能够快速地进入市场,主要是可用来做第一代产品研发或者是高端机产品。一旦AI作为PC标配的话,基本上FPGA就会被ASIC或者SoC所替代。那么FPGA在PC的是否还有足够的市场机会?可突破的点有哪些?


针对EETOP小编的这些疑问,谢征帆分享说:“还会有一些专有市场或者细分市场。在细分市场,比如电竞行业中电竞的显示器,显示器和主机之间的通信,因为电竞PC在性能或某些功能上会有额外的需求,是目前的平台无法满足的,这时FPGA就大有用处了。”此外,FPGA+CPU的组合方式,也可以让PC在功耗和性能之间得到有效平衡。据介绍,莱迪思的FPGA产品主打的就是小尺寸低功耗,平时可以作为始终开启的芯片做预处理工作,当出现的确需要处理的事情时,才真正唤醒CPU,让其在后台做一些更加复杂的工作。


其实,在汽车领域,FPGA也面临着同样的问题。最早我们的芯片应用于汽车领域就是用在电机控制,主要是电机操作的控制功能。FPGA可以提供极高的安全性,而电机控制直接涉及到马达控制,其安全保障的要求是非常高的。但一旦汽车功能模块在某个领域成熟以后都会被ASIC所替代。不过,汽车领域依然是FPGA非常重要的竞技场。谢征帆表示:”我们也看到在汽车领域不断有新需求出现,FPGA会在不断涌现的创新领域发光发热。当前FPGA很多是应用在视频过程,在CMS或者Local Dimming,可能是因为在整个汽车里面这部分功能还没有完全固化下来,比如汽车里面的屏会越来越多,而且屏的位置、功能、方法都不一样。正是因为这些东西还在研究过程中,所以我们认为FPGA在这里面会有立足之地。”


在莱迪思看来,面向生成式AI有两个方向其一是平台级管理的芯片生成式AI基于服务器或者基于PC架构都会涉及到平台管理,而平台管理中每一个服务平台都有FPGA平台管理的CPU,都需要非常精确的时间管理,这些时间管理是没有办法用软的管理,这个是FPGA存在的价值所在。第二是关于安全性。生成式AI会有大量的数据汇集到平台上,对数据管理包括平台架构基础的功能管理,都对安全性提出了更高要求。传统上是用TPM方式,属于被动器件,它有个缺点,即需要CPU或者主处理器启动后再去调用它。在CPU开始工作和启动TPM之间,就存在一个时间差,黑客很容易利用这个空档进行攻击。莱迪思正在考虑一个方案,叫T-1思路就是在平台级CPU或GPU或大颗FPGA工作之前,由T-1芯片先做验证。


现在FPGA的性能越来越高,提供的都是完整的经过验证的IP,对开发者来说,就像搭积木一样,且留给客户足够多的冗余空间。并且随着FPGA变成片上系统之后,硬件开发者再来开发FPGA,已经慢慢转成系统架构的设计师的角色转换。因此,从这个角度说,其实FPGA的开发难度又在增加,因为可能你开发的FPGA就是主CPU,开发者对系统的架构要有更多的理解。对于如何感知世界这取决于多项技术的同时进步包括嵌入式算法感知视觉等如何能更好的融合在一起是当前需要考虑的


芯片精品课程推荐

(本课提供在线答疑,购课后课添加微信:ssywtt 拉你入群)

EETOP EETOP半导体社区-国内知名的半导体行业媒体、半导体论坛、IC论坛、集成电路论坛、电子工程师博客、工程师BBS。
评论
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 122浏览
  • 本文介绍编译Android13 ROOT权限固件的方法,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。关闭selinux修改此文件("+"号为修改内容)device/rockchip/common/BoardConfig.mkBOARD_BOOT_HEADER_VERSION ?= 2BOARD_MKBOOTIMG_ARGS :=BOARD_PREBUILT_DTB
    Industio_触觉智能 2025-01-08 00:06 100浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 211浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 145浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 172浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 127浏览
  •  在全球能源结构加速向清洁、可再生方向转型的今天,风力发电作为一种绿色能源,已成为各国新能源发展的重要组成部分。然而,风力发电系统在复杂的环境中长时间运行,对系统的安全性、稳定性和抗干扰能力提出了极高要求。光耦(光电耦合器)作为一种电气隔离与信号传输器件,凭借其优秀的隔离保护性能和信号传输能力,已成为风力发电系统中不可或缺的关键组件。 风力发电系统对隔离与控制的需求风力发电系统中,包括发电机、变流器、变压器和控制系统等多个部分,通常工作在高压、大功率的环境中。光耦在这里扮演了
    晶台光耦 2025-01-08 16:03 75浏览
  • 故障现象一辆2017款东风风神AX7车,搭载DFMA14T发动机,累计行驶里程约为13.7万km。该车冷起动后怠速运转正常,热机后怠速运转不稳,组合仪表上的发动机转速表指针上下轻微抖动。 故障诊断 用故障检测仪检测,发动机控制单元中无故障代码存储;读取发动机数据流,发现进气歧管绝对压力波动明显,有时能达到69 kPa,明显偏高,推断可能的原因有:进气系统漏气;进气歧管绝对压力传感器信号失真;发动机机械故障。首先从节气门处打烟雾,没有发现进气管周围有漏气的地方;接着拔下进气管上的两个真空
    虹科Pico汽车示波器 2025-01-08 16:51 86浏览
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 113浏览
  • 「他明明跟我同梯进来,为什么就是升得比我快?」许多人都有这样的疑问:明明就战绩也不比隔壁同事差,升迁之路却比别人苦。其实,之间的差异就在于「领导力」。並非必须当管理者才需要「领导力」,而是散发领导力特质的人,才更容易被晓明。许多领导力和特质,都可以通过努力和学习获得,因此就算不是天生的领导者,也能成为一个具备领导魅力的人,进而被老板看见,向你伸出升迁的橘子枝。领导力是什么?领导力是一种能力或特质,甚至可以说是一种「影响力」。好的领导者通常具备影响和鼓励他人的能力,并导引他们朝着共同的目标和愿景前
    优思学院 2025-01-08 14:54 82浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦