为了克服CPU和GPU的限制,为人工智能推理工作负载专门设计的创新型硬件加速器,可实现高效和优化的处理,同时最大限度地减少能耗。

人工智能行业所围绕的是一个受技术进步、社会需求和监管政策影响的动态环境。机器学习、自然语言处理和计算机视觉方面的技术进步,加速了人工智能的发展和应用。包括医疗保健、金融和制造业在内的各个行业对自动化、个性化和效率的社会需求,又进一步推动了人工智能技术的集成。此外,不断发展的监管体系,则强调了合乎伦理道德的人工智能、数据隐私和算法透明度的重要性,进而指导人工智能系统的负责任开发和应用。

人工智能行业将训练和推理过程结合起来,有效地创建和部署人工智能解决方案。推理和训练都是人工智能整个生命周期的组成部分,其意义取决于具体的环境和应用。对于通过学习模式和从数据中提取见解来开发和优化模型而言,虽然训练极为重要,但推理在利用这些训练模型进行实时预测和决策方面,却发挥着极为重要的作用。人工智能推理(占当今人工智能任务的80%以上)的重要性越来越大,在于它在推动数据驱动的决策、个性化用户体验和不同行业的运营效率方面发挥着关键作用。

高效的人工智能推理实现,则面临着数据可用性、计算资源、算法复杂性、可解释性和法规符合性方面的挑战。而在控制成本的同时,适应动态环境和管理可扩展性,还又带来额外的挑战。克服这些挑战需要全面的战略,包括稳健的数据管理实践、硬件功能的进步和算法的改进。开发可解释的人工智能模型,并遵守道德和监管准则,对于建立用户信任和确保合规性至关重要。此外,通过高效的运营实践与技术创新来平衡资源分配与成本管理,对于在不同行业部门实现可持续有效的人工智能推理解决方案也极为重要。

人工智能推理的关键作用

通过自动化任务、增强预测性维护和启用高级分析,人工智能推理优化了流程,减少了错误,改善了资源分配。对于自然语言处理,人工智能推理提供了动力,改善了人与机器之间的沟通与理解。而在制造业领域,其影响包括预测性维护、质量控制和供应链管理、提高效率、减少浪费和提高产品质量,对行业运营具有变革性影响。

可持续人工智能推理的行业挑战

人工智能推理面临着高能耗、密集的计算需求和实时处理限制等挑战,导致运营成本增加,还加剧了对环境的影响。人工智能总功耗的60%以上来自推理,随着推理需求的增加,导致数据中心容量在两年内增加了2.5倍(GAFA数据)。对于服务器来说,密集计算过程中产生热量,还需要复杂的冷却系统,这又进一步增加了人工智能过程的总体能耗。此外,在服务器、高级驾驶员辅助系统(ADAS)或制造应用中,必须在满足高效实时处理需求与低延迟要求之间取得平衡,这也是一个重大挑战,需要先进的硬件设计和优化的计算策略。在不影响准确性的情况下,优先考虑可再生能源和环保举措的节能解决方案,对于减轻环境影响而言,是非常重要的。

由于人工智能算法的复杂性和特殊性,利用CPU或GPU的经典人工智能推理硬件设计,在实现能效方面面临限制,导致高功耗(服务器每个多核单元功耗高达数百瓦)。处理单元与存储器之间低效的数据移动,进一步影响了能源效率和吞吐量。例如,相对于访问本地寄存器,访问外部DRAM会消耗200倍的能量。最终,由于更高的计算需求,到2025年,利用CPU和GPU的下一代服务器,可能会消耗高达上千瓦的功率。而在资源受限、电池供电的设备上部署人工智能推理更具挑战性,因为最高效的基于CPU和GPU的低功耗设计(10毫瓦到几瓦)受到吞吐量的极大限制,从而限制了人工智能的复杂性和最终的用户体验。平衡能源效率与性能/精度要求,在设计过程中需要仔细权衡,并采用全面的优化策略。对复杂人工智能工作负载的硬件支持不足,可能会阻碍其能效和性能。

寻找节能解决方案

行业对节能人工智能推理解决方案的需求不断增长,这是由可持续发展目标、成本降低目标和新用途共同驱动的。企业寻求可扩展和高性能解决方案,来管理复杂的人工智能工作负载,而不会产生过高的能源成本。另一方面,节能的人工智能推理,使得移动设备或资源受限的设备能够在不快速消耗电量的情况下执行复杂任务,同时减少对云处理的依赖,最大限度地减少数据传输和延迟问题。通过高级新功能,如实时语言翻译、个性化推荐和准确的图像识别,有助于增强用户体验,提高用户参与度和满意度。

人工智能推理领域里的创新贡献

为了克服CPU和GPU的限制,为人工智能推理工作负载专门设计了创新型硬件加速器,实现高效和优化的处理,同时最大限度地减少能耗。人工智能应用中,此类加速器通过采用专用运算符(池化、激活功能、规范化等)来实现优化的数据流。数据流引擎是矩阵乘法单元,这是一个大型处理元件阵列,能够有效地处理大型矩阵向量乘法、卷积和许多更复杂运算。大多数神经网络都是基于矩阵乘法运算的。

为了进一步优化能源效率,人工智能加速器已经实现了一些新技术,如近内存计算。近内存计算将处理单元集成在内存子系统中,从而实现更快的近内存数据处理,从而减少与数据传输相关的能耗。最近,又出现了采用“非标准”技术的一些新解决方案,如存内计算或尖峰神经网络(SNN)。要实现高效能人工智能推理,这些都是最具吸引力的解决方案。

存内计算直接在内存中进行电路级计算,免去了数据传输,提高了处理速度。处理可以以模拟或数字方式进行,可利用不同的存储技术,如SRAM、闪存或新的NVM(RRAM、MRAM、PCRAM、FeFET等)。这种方案特别有利于涉及大型数据集的复杂人工智能任务。SNN还代表了人工智能推理的一种创新解决方案:它们通常由通过尖峰进行通信的互连节点组成,能够模拟复杂的时间过程和基于事件的计算,这对于处理时间敏感数据或模拟人脑行为等任务很有用。

塑造人工智能推理的未来

利用近内存/存内计算或SNN的人工智能加速器对人工智能行业产生了重大影响,包括提高能源效率、提高处理速度和先进的模式识别能力。这些加速器推动硬件设计的优化,从而为特定的人工智能工作负载创建专门的架构。此外,它们还促进了边缘计算的进步,促进了直接在边缘设备上进行高效的人工智能处理,并减少了延迟。这些技术的变革潜力,凸显了其在从医疗保健、制造业、汽车到消费电子等不同行业的革命性变革中的关键作用。

高能效人工智能推理在医疗保健和汽车行业的集成产生了变革性的影响。在医疗保健领域,通过快速数据分析促进了更快的诊断和个性化的患者护理,从而改善了治疗效果和量身定制的医疗干预措施。此外,它还赋能开发远程患者监测系统,确保对慢性病患者进行持续的健康跟踪和积极干预。还有,在药物研发领域,高效人工智能推理加快了潜在候选药物的识别,加速了药物研发过程,促进了医疗和疗法的创新。

在汽车行业,节能的人工智能推理在提升安全功能和自动驾驶能力方面也发挥着至关重要的作用。它为车辆提供ADAS和实时碰撞检测功能,增强整体道路安全。此外,它有助于自动驾驶技术的发展,使车辆能够根据实时数据分析做出明智决策,从而改进导航系统和自动驾驶功能。此外,基于人工智能推理的预测性维护解决方案,能够早期检测潜在的车辆问题、优化性能、减少停机时间并延长车辆寿命。

结论

行业对节能人工智能推理解决方案的主要需求,是由促进可持续运营、优化资源利用和延长设备电池寿命的需求驱动的。这些解决方案在促进环保实践、降低运营成本和增强竞争优势方面发挥着关键作用。节能人工智能推理解决方案中,通过促进边缘计算应用,并最大限度地减少能源消耗,使企业能够提高盈利能力、简化流程、并确保移动和物联网设备功能的不间断。要满足这些需求,就必须开发大量基于智能近内存/存内计算技术的节能算法,并优化硬件架构。许多新公司带着创新的计算解决方案进入市场,并承诺在从传感器到数据中心的任何地方运行人工智能,以提供全新的用户体验。

(原文刊登于EE Times欧洲版,参考链接:Revolutionizing AI Inference: Unveiling the Future of Neural Processing,由Franklin Zhao编译。)

本文为《电子工程专辑》2024年4月刊杂志文章,版权所有,禁止转载。免费杂志订阅申请点击这里

责编:Franklin
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
由此可见,荣耀Magic7系列搭载的AI功能,并非是简单的“小模型”,也不单纯是上一个版本的升级,更像是手机智能化的“跨越性”进步。
具体来说,对于涉及某些先进集成电路设计或制造、超级计算机、量子计算机及其关键部件、以及特定用途的AI系统的交易,美国将采取禁止或要求通报的措施。
Credo公布了2025财年第一个季度的业绩,营业收入同比增长了70%左右。随着AI时代的兴起,Credo开始关注如何把AEC更好的应用在国内的数据中心市场中。此外,在当今的数据中心领域,网络正在经历巨大的变革......
根据SemiAnalysis公司首席分析师Dylan Patel的说法,目前SK海力士在HBM市场的整体份额超过70%,其中HBM3的市场份额超过85%。
Gartner高级首席分析师 Rajeev Rajput 在一份声明中表示:“人工智能相关半导体需求的持续激增和电子产品生产的复苏推动了这一增长,而汽车和工业部门的需求仍然疲软。短期内,存储市场和图形处理单元(GPU)将推动全球半导体收入。”
该男子坦言,自己缺乏IT专业技能,强调“没有生成AI的帮助,根本无法制作出这种病毒”。若非因涉及SIM卡诈骗被捕,该病毒很可能已被用于实际犯罪活动。
微电子和软件技术的快速发展正在深刻地改变车载娱乐中控和安全系统设计,重新定义驾驶体验。
本系列文章从数字芯片设计项目技术总监的角度出发,介绍了如何将芯片的产品定义与设计和验证规划进行结合,详细讲述了在FPGA上使用硅知识产权(IP)内核来开发ASIC原型项目时,必须认真考虑的一些问题。
在即将到来的慕尼黑国际电子元器件博览会(electronica 2024)上,英飞凌科技股份公司将展示其创新的解决方案如何推动全球低碳化和数字化进程,充分展现半导体产品如何为实现净零经济铺平道路,并释放人工智能的全部潜力。
vivo旗下品牌iQOO正式发布了年度性能旗舰iQOO 13,除了高通骁龙8芯片、vivo自研的电竞芯片Q2外,最值得一提的是还采用了汇顶科技提供的多项创新技术,包括超声波指纹识别、新一代屏下光线传感器以及智能音频放大器与软件方案。
来源:《中国半导体大硅片年度报告2024》2016 年至 2023 年间,全球半导体硅片(不含 SOI)销售额从 72.09 亿美元上升至121.29 亿美元,年均复合增长率达 7.72%。2016
国芯网[原:中国半导体论坛] 振兴国产半导体产业!   不拘中国、放眼世界!关注世界半导体论坛↓↓↓10月31日消息,据报道,一名在华韩国人A某因涉嫌违反《中华人民共和国反间谍法》被逮捕!我外交部29
本文来源:智能通信定位圈10月24日,全球领先的物联网(IoT)解决方案提供商Silicon Labs(下称“芯科科技“)在上海成功举办2024年“Works With开发者大会”。本届大会以“创新结
10月30日,备受瞩目的iQOO最新旗舰机——被誉为“性能之光”的iQOO 13在深圳震撼发布。该款机型由BOE(京东方)独供6.82英寸超旗舰2K LTPO直屏,行业首发搭载全新一代Q10发光器件,
01周价格表02周价格观察硅料环节本周硅料价格:单晶复投料主流成交价格为37元/KG,单晶致密料的主流成交价格为35元/KG;N型料报价为41元/KG。交易情况上下游交易延续低迷情绪,拉晶端尚处艰难去
10月29日,诺基亚与惠普宣布签署了一项多年专利授权协议,允许惠普公司在其设备中使用诺基亚的视频技术。诺基亚一年前曾表示,已在美国对惠普提起法律诉讼,指控惠普未经授权使用诺基亚专利的视频相关技术,但本
东芝电子元件今日宣布,开始提供适用于3相直流无刷电机的栅极驱动[1]IC——“TB9084FTG”的工程样品。这款器件可用于驱动包括车身系统应用[2]、电动泵以及电机发电机[3]在内的关键车载功能。该
市场传出消息称,荣耀公司近期引入了包括中国电信、中金资本旗下基金、基石旗下基金、特发基金及新一轮代理商投资平台(金石星耀)等在内的多个投资者。           对于本轮融资,荣耀表示始终坚持公开透
在人工智能、安全和互连不断发展的时代,我们为您准备了FPGA创新的最前沿资讯,助您进一步提升系统设计和开发水平。您可以在莱迪思开发者大会上探索相关趋势、挑战和机遇,发现最新的低功耗FPGA解决方案!莱
本文来源:智能通信定位圈01蜂窝物联网行业寡头效应正加剧表:历年蜂窝物联网模组Top5企业在全球范围内的市场份额(按出货量)数据来源:Counterpoint Research在总的出货量上,2022