2022年2月14日,AMD顺利完成了对可编程逻辑器件(FPGA)巨头赛灵思(Xilinx)的收购。最新的财报数据显示,得益于该项收购,AMD嵌入式业务2023年全年营收53亿美元,同比增加17%。而就在完成收购两周年前夕,AMD再接再厉,宣布推出创新型Embedded+架构。
“这一全新的架构解决方案将AMD Ryzen™(锐龙)嵌入式处理器和AMD Versal™自适应SoC结合到单块集成板卡上,为原始设计制造商(ODM)合作伙伴加速产品上市,提供了可扩展且高能效的解决方案。”AMD工业、视觉、医疗和科学市场高级总监Chetan Khona在接受《电子工程专辑》采访时表示,Embedded+侧重于工业、医疗、智慧城市、汽车等领域,是“两家公司产生协同效应的一个很好的例证”。
Embedded+有何过人之处?
与AMD此前推出的Kria自适应系统模块(SOM)不同的是,Embedded+架构指向更加偏PC类型的应用,在这些应用中我们能看到键盘、鼠标、显示、以及Linux/Windows操作系统,并非纯粹的嵌入式环境。同时,由于X86处理器的存在,应用库的类型会更加丰富。
以自动化系统中的传感器数据分析为例,可能会更有助于我们理解AMD为何要推出Embedded+架构。
Chetan Khona说,当前的工业和医疗应用,包括仓储自主移动机器人(AMR)、工厂自动化摄像头、过程自动化控制器、用于交通流量管理的智慧城市AI盒子、无人零售、外科手术机器人、医学成像等,对多样化传感器数据的依赖比以往更甚,许多决策需要在几毫秒内做出,而这些关键决策所依赖的数据必须根据尽可能最新的信息运行,才能实现最低时延和确定性响应。因此,只有更靠近传感器进行处理,才能使数据价值最大化,而为了使处理更靠近传感器,则需要优化的嵌入式PC。
但在实际应用中,数据导入PC的过程并非总是一帆风顺,典型情况之一就是嵌入式PC能够适配的传感器和网络类型有限,导致应用领域受限。或者是没有相应的元器件帮助CPU实现“功能卸载”,导致其在低延时、实时控制、AI推理、视频解码/渲染/显示等方面高度依赖CPU,使其不堪重负。
而Embedded+架构率先将AMD x86计算与集成显卡和可编程硬件相结合,用于关键的AI推理和传感器应用。自适应计算在确定性、低时延处理方面表现出色,而AI引擎则能够提升高每瓦性能推理。锐龙嵌入式处理器包含高性能“Zen”核心和Radeon™显卡,还可提供极为卓越的渲染和显示选项,提升4K多媒体体验,同时,内置的视频编解码器可用于4K H.264/H.265编解码。
低时延处理和高每瓦性能推理的结合可为关键任务实现高性能,包括将自适应计算与灵活的I/O、用于AI推理的AI引擎以及AMD Radeon显卡实时集成到单个解决方案中,发挥每项技术的最大优势。
同时,Embedded+集成计算平台经过AMD验证,可助力ODM客户缩短认证和构建时间以便更快进入市场,而无需耗费额外的硬件和研发资源。采用Embedded+架构的ODM 集成支持使用通用软件平台开发低功耗、小尺寸规格及长生命周期的设计,适用于医疗、工业以及汽车应用。
三大特点,一一解读
虽然做了不少介绍,但可能还是会有不少人认为Embedded+架构缺乏创新,认为它不过是通过PCIe接口将锐龙嵌入式处理器与Versal自适应SoC连接在同一块PCB板上而已。为了打消这样的看法,Chetan Khona特意从以下三方面做了更为详尽的解读:
- 传感器友好型
简单而言,就是Embedded+可以使用Versal自适应SoC可编程I/O,适配各类传感器和网络,在模拟-数字边界执行传感器处理以实现最大响应能力,或是为传感器融合提供本地支持。
以下两图为我们展示了这样的能力。可以看出,锐龙嵌入式处理器与Versal自适应SoC的结合,可以提供与传统PC、网络设备、实时传感器和工业网络的连接选择,84种不同的I/O类型可提供广泛的速度(最高32Gb/s)与电压范围,也可根据应用要求为传感器接口和网络配置可编程I/O。
在机器视觉应用中,搭载集成机器视觉图像采集卡的IPC,通过SFP+实现与摄像头的10GigE视觉和CoaXpress连接,并以像素时钟速率执行图像预处理,无需缓存。由于 可编程I/O能在多个摄像头与驱动器之间实现紧密同步,进而简化了多传感器/多角度图像采集。同时,低功耗与紧凑的尺寸支持PC与摄像头进行集成,而非通过线缆连接到PC,这样一来,需要采购的组件更少,使用也更简便——只需连接摄像头即可。
当被应用于具备运动规划功能的机器人控制器时,采用Mini ITX尺寸规格提供且功耗约30W的Embedded+架构可实现混合关键传感器融合:
- 通过锐龙嵌入式处理器支持WiFi、GPS、IMU、激光雷达等常见的低速接口;
- 通过Versal自适应SoC支持多个GMSL2摄像头、互联等低时延接口;
- 用于导航的软件协议栈和路径规划基于成熟的x86处理器运行;
- FPGA可消除诸如VSLAM中的立体匹配(stereo matching)等瓶颈,获得更高性能;
- 可在AI引擎上加速AI模型推理;
- 卸载处理
x86处理器虽然是架构的核心,但如果在x86处理器四周环绕了可减负的元器件,就可实现面向确定性低延迟的通信和处理的可编程逻辑、高每瓦性能推理的AI引擎,以及精湛可视化效果的集显等。
举例而言,如果需要低时延、确定性网络和传感器接口,Embedded+可以提供扩展连接器、可编程I/O和FPGA的互联架构;如果需要实时控制,就可以提供Arm的子系统和FPGA的互联架构;如果需要AI推理,Embedded+ AI引擎会通过Versal™ AI Edge的系列产品提供支撑;如果需要视频解码、渲染和显示,Embedded+架构能够提供H.264/265的视频编解码器和Radeon显卡。
- 快速上市
Embedded+架构针对传感器融合,AI推理、工业互联、控制和可视化等进行了专门的优化,而且利用通用软件技术架构连接解决方案的各个部分,适用于不同的工作负载。例如开发人员可以选择两种通信流,或者是半定制/全定制两种模式,在Vitis XRT工具的支持下实现锐龙和Versal之间的通信。硬件方面,除了扩展连接器之外,ODM厂商还会提供扩展板和定制板,让终端用户的产品能够快速面市。
此外,Embedded+还支持系统设计人员在基于Embedded+架构的ODM板卡产品生态系统中进行选择,并扩展其产品组合,提供最适合客户目标应用的性能和功耗配置。
首款基于Embedded+架构的ODM解决方案为Sapphire Edge+ VPR-4616-MB,这是一款来自Sapphire Technology的低功耗Mini-ITX主板。它采用锐龙嵌入式R2314 处理器和Versal AI Edge VE2302自适应SoC,以低至30W的功耗提供了全套功能。此外,VPR-4616还适用于全系统,包括内存、存储、电源和机箱。
Chetan Khona表示,在2024年年底之前,AMD还将推出一系列的示范设计,包括:支持AI推理功能的传感器融合,通过扩展连接器/解编码器实现视频AI推理;用于AMR自主移动机器人的8路GMSL、激光雷达+GPS+IMU+WIFI连接的接口;以及支持时间敏感型网络和其他工业以太网标准,传输速度超过10GE的机器视觉图像采集卡等。
但需要强调的是,Embedded+产品的销售价格不是由AMD,而是由其ODM生态合作伙伴来决定的,AMD在其中只扮演技术合作伙伴的角色。
结语
作为一家可以同时提供x86、显卡、FPGA和自适应SoC技术的公司,AMD无疑具备了很好的出发条件。但Chetan Khona也坦承,“融合创新过程中肯定会存在挑战”,比如如何将不同的技术融合在一起,通过集成的软件栈提供给客户,这既是挑战,也是非常大的机会。从目前的发展态势来看,双方进一步完善了软件能力和软件可用性,针对AI引擎提供了更强大的用例,将已有的创新和能力带到了新的层级,显现出了1+1>2的优势。