在近日举办的第八届EEVIA年度中国ICT媒体论坛暨2019产业和技术展望研讨会上,人工智能也是其中的一个重要主题。自适应和智能计算的全球领先企业赛灵思公司人工智能市场总监刘竞秀在“FPGA — 人工智能计算的加速引擎”的主题演讲中开场就对“智能+”概念作出了通俗的诠释:“AI的本质就是高性能计算,就像电力一样是一项通用能力,是能对所有行业进行产业升级以及产品迭代起促进作用的存在。”

“深化大数据、人工智能等研发应用,培育新一代信息技术、高端装备、生物医药、新能源汽车、新材料等新兴产业集群,壮大数字经济。”“打造工业互联网平台,拓展“智能+”,为制造业转型升级赋能。”……刚闭幕不久的中国两会上,人工智能(AI)连续第三年被写入政府工作报告中,并首次将人工智能衍生为“智能+”的概念。作为国家战略的人工智能将加速与产业融合,为经济结构优化升级发挥重要作用。

在近日举办的第八届EEVIA年度中国ICT媒体论坛暨2019产业和技术展望研讨会上,人工智能也是其中的一个重要主题。自适应和智能计算的全球领先企业赛灵思公司人工智能市场总监刘竞秀在“FPGA — 人工智能计算的加速引擎”的主题演讲中开场就对“智能+”概念作出了通俗的诠释:“AI的本质就是高性能计算,就像电力一样是一项通用能力,是能对所有行业进行产业升级以及产品迭代起促进作用的存在。”

Xilinx Feature-如何破解两把“剪刀差”加速AI落地?Xilinx给出了答案-图1.jpg

刘竞秀:AI的本质就是算力,是像电力一样的一项通用能力。

破解两把“剪刀差”的掣肘,关键“方法论”是FPGA

对人工智能落地速度的表现刘竞秀似乎并不满意,他认为当前顶多应该算是“智能服务”的时代,而不是真正人工智能的时代。他将当前的语音人机对话、智能视频应用等落地项目认为是比较初期的智能应用,“例如,人机对话可以用于最基本的生活服务,但很难真正对话超过20句,后面基本上是尬聊。”与产业和媒体关注热度相比,人工智能这几年真正落地的速度有点慢,刘竞秀给出了两个剪刀差阻碍发展的关键判断。

首先是海量的数据和计算芯片所能够提供的处理能力之间的“剪刀差”,主要表现在受限于摩尔定律,传统芯片算力的进步已经远远跟不上爆炸性增长的数据对算力的需求;其次是芯片开发的长周期和快速迭代的市场和技术发展之间的“剪刀差”,传统芯片开发的完整的流程通常长达18~24个月,然而当前的AI项目经常需要几个月就提出解决方案,从而抢占市场。按照过去的芯片漫长的研发流片流程,当芯片出货时市场需求可能已经发生了根本的改变。

Xilinx Feature-如何破解两把“剪刀差”加速AI落地?Xilinx给出了答案-图2.jpg

 

异构架构是普适智能时代加速新工作负载的趋势。

另外一个不争的事实是,目前AI芯片已经发展到需要采用28纳米甚至16纳米制造工艺,倘若AI算力的需求全靠工艺的迭代,所需的资金投入和风险都是一般中小企业或创新创业企业难以承受的,而且鉴于时间窗口问题,几乎没有企业愿意或有实力在这块市场进行尝试。“因此具备可编程性且灵活多变的FPGA便成了最好的选择。人工智能创新企业可以将其核心研发资源聚焦在特定领域(算法和框架方面)和应用上,从这些层面来创造更多的价值。”刘竞秀指出。

Xilinx Feature-如何破解两把“剪刀差”加速AI落地?Xilinx给出了答案-图3.jpg
常见的AI落地应用场景。

ACAP让AI“飞起来”,首个自适应计算平台再加速

在赛灵思发明FPGA以来的35年中,这种可编程逻辑器件凭借性能、上市时间、成本、稳定性和长期维护方面的优势,在通信、医疗、工控和安防等领域均拥有了无法取代的一席之地。然而,也是需要和传统处理器“分庭抗礼”的一席之地。但最近几年,由于云计算、高性能计算和人工智能的兴起,拥有先天优势的FPGA有望开始“独领风骚”的时代。

按赛灵思财报显示的数据,FPGA在人工智能领域强大的优势和发展前景,以及赛灵思为此历经数年推动的公司转型, 让赛灵思在过去三年内股价增长近三倍。从单纯的FPGA到集成DSP、内存,到28nm集成Arm以及RFSoC的推出,赛灵思一直都是在用创新技术驱动应用创新,显然赛灵思的前瞻性战略布局并不会满足于收割在人工智能时代FPGA的优势“老本”,特别是总裁兼CEO Victor Peng上任以来更是在人工智能领域动作频频,以数据中心优先、加速主流市场的增长和驱动灵活应变的计算三大战略更加清晰化市场布局,其ACAP(自适应计算加速平台)的全新品类的
推出为扩大人工智能产业优势奠定了关键伏笔。

作为高度集成的多核异构计算平台,ACAP被媒体称为赛灵思面向下一点计算“蝶变”的利器,是赛灵思器件家族的新物种。为打造ACAP,赛灵思投入上千工程师,历经五年研发,投资逾10亿美元。其核心是新一代FPGA架构,能根据各种应用与工作负载的需求从硬件层对其进行灵活修改。ACAP的灵活应变能力可在工作过程中进行动态调节,它的功能将远超FPGA的极限。在本次论坛上,刘竞秀也对ACAP第一款产品Versal做了阐释:“顾名思义,Versal等于various(各种不同的、各种各样的)+ Universal (通用的,万能的) , 可以支持所有的开发者的各种应用。这是一款完全支持软件编程的异构计算平台,可将标量引擎、自适应引擎和智能引擎相结合,实现显著的性能提升,其速度超过当前最高速的 FPGA 20 倍、比当今最快的 CPU 实现快 100 倍。”

Xilinx Feature-如何破解两把“剪刀差”加速AI落地?Xilinx给出了答案-图4.jpg
Versal ACAP自适应计算加速平台

Versal系列产品均基于台积电最新的7nm FinFET工艺,是第一个将软件可编程性与特定领域硬件加速和灵活应变能力完美结合的平台。该平台独特的架构针对云端、网络、无线通信乃至边缘计算和端计算等不同市场的众多应用,提供了独特的可扩展性和AI推断功能,将为所有开发者开发新应用开启一个最新且最快速的创新时代。赛灵思已经发布了Versal基础系列和Versal AI核心系列,Versal旗舰系列、AI Edge以及Versal HBM系列将在未来陆续发布。

从硬件平台到算法模型,完整工具链让AI轻松落地

人工智能的爆热与庞大的市场前景为全球半导体市场注入了“兴奋剂”,也为几乎所有的半导体公司所觊觎。目前,市场上已不断有各种新的处理器产品方案发布。“把芯片本身做出来不难,但如果没有足够高性能的软件、生态环境、工具链以及各种参考应用,应用落地将需要花费更长的时间。”刘竞秀表示。对于赛灵思,丰富的FPGA传统芯片组合以及创新的ACAP平台为AI落地提供了众多选择。“对于客户AI开发而言,传统的解决方案提供的支持还远远不够,赛灵思为客户提供了更多的不同层次的支持,除了底层硬件、各种IP以及软件,还提供了应用层各种神经网络模型。”刘竞秀指出。赛灵思公司拥有非常丰富的神经网络模型库。据悉,仅视觉相关的神经网络模型就超过70种。随着在AI市场的快速崛起,赛灵思正在从传统的芯片提供商向平台方案提供商转变。

Xilinx Feature-如何破解两把“剪刀差”加速AI落地?Xilinx给出了答案-图5.jpg

赛灵思在人工智能/边缘/嵌入式和云端/数据中心总体解决方案。

据刘竞秀透露,在收购深鉴科技后,深鉴科技上百人的研发团队继续专注在赛灵思DNNDK(深度神经网络开发套件)的研发上。DNNDK面向AI异构计算平台深度学习处理器DPU (深度学习处理器单元),可支持神经网络推理阶段模型压缩、编译优化和高效运行时支持的不同功能需求,为DPU平台各种深度学习应用开发和部署提供一套高效全栈式解决方案,实现从深度学习算法到DPU硬件平台的高效映射,为DPU从移动端到数据中心端各类应用提供统一的开发工具包和编程接口。

DNNDK在极大降低DPU平台深度学习应用开发门槛和部署难度的同时,还能够显著加速AI产品从开发到面市的进程。“赛灵思在方案底层定义了高效的指令集和IP,结合成套的工具和SDK为客户提供的接口,客户甚至不需要写任何一行代码,只需要把我们IP资源调用起来,就可以支持不同行业不同场景的应用。”刘竞秀表示。赛灵思通过打造通用的处理器平台和完善的工具集,努力为客户提供卓越的高效率开发体验。

Xilinx Feature-如何破解两把“剪刀差”加速AI落地?Xilinx给出了答案-图6.jpg
赛灵思边缘计算人工智能解决方案

人工智能在具体应用场景的落地是一个复杂的开发过程。据悉,传统处理器开发周期可以达到三至六个月,甚至一年都是常见的。“用我们现有的方案,最快几个小时就可以把新的网络部署在硬件上,快速地将系统运行起来。”刘竞秀强调。速度对当前的人工智能创业公司和合作伙伴而言是最重要的考虑要素之一,通过快速实现原型机,从而尽早去实现真正的场景性能、功能迭代和数据收集,才能将产品比别人更快地推向市场。

Xilinx Feature-如何破解两把“剪刀差”加速AI落地?Xilinx给出了答案-图7.jpg
赛灵思人工智能视频分析模型库

相关阅读利用本性、借力培育打造令人惊叹的AI SoC

  

阅读全文,请先
您可能感兴趣
自研AI芯片计划是OpenAI在硬件领域的一次重要战略调整。如果此次试产过程顺利进行,OpenAI将能够量产其首款自研AI芯片,并可能在今年晚些时候测试英伟达AI芯片的替代品。
在成本方面,使用特定水平AI的成本每12个月下降约10倍,较低的价格会促进更多使用。从2023年初的GPT-4到2024年中期的GPT-4o,每个token的价格下降了约150倍。
2024 年,全球半导体市场迎来了历史性的增长。销售额首次突破 6000 亿美元,达到 6276 亿美元(约 4.58 万亿元人民币)……
这笔巨额投资将重点支持基础研究、技术转化、应用实例与生态系统建设等关键领域。
台积电对中国大陆的集成电路实施一系列严格的供应限制,特别是针对16/14nm工艺及以下的产品,不在BIS白名单中的“approved OSAT”进行封装,并且台积电没有收到该封装厂的认证签署副本,这些产品将被暂停发货。这一发货限制,将使得16/14nm及以下工艺的相关产品在出口到中国大陆时,生产和封装环节变得更加透明......
许多人认为这可能是 AI 模型训练领域的一次重大突破,预示着未来 AI 模型的训练和应用将更加平民化。然而,随着更多细节浮出水面,事实似乎并不像最初报道的那样简单。
全球人形机器人领域上市公司的百强名单将人形机器人产业链区分为大脑、身体以及集成三大核心环节,覆盖全球共计100家上市公司。中国共37家企业上榜(中国大陆32家,台湾5家),其中深圳7家,占中国大陆上榜企业近四分之一,包括比亚迪、腾讯、优必选、速腾聚创、雷赛智能、兆威机电、汇川技术等......
DeepSeek模型虽降低AI训练成本,但AI模型的低成本化可望扩大应用场景,进而增加全球数据中心建置量。光收发模块作为数据中心互连的关键组件,将受惠于高速数据传输的需求。未来AI服务器之间的数据传输,都需要大量的高速光收发模块......
凭借新一代3nm制程工艺与全新架构,骁龙® 8至尊版的单核和GPU 性能提升均超过 40%,使得Find N5在性能上实现质的飞跃……
简化物联网连接:应用就绪型软件构建模块
2月10日,市场调查机构 IDC 发文称,2024 年全年中国平板电脑市场出货量为 2985 万台,同比增长 4.3%,市场迎来回暖。报道称, 2024 年第 4 季度市场出货量为 786 万台,受库
据IT业界9日报道,苹果公司最近进入了“可折叠iPhone”零部件供应商选择的最后阶段,据观察,三星显示器已决定独家供应初期面板量。据悉,三星将供应约1500万至2000万片,并将于明年5月开始量产,
三极管基极和发射极端并联电阻主要是为了提高电路的可靠性:1、三极管的基极不能出现悬空,当输入信号不确定时(如输入信号为高阻态时),加下拉电阻,可有效接地,防止三极管受噪声信号的影响而产生误动作,使晶体
RS90LV049是一款双通道LVDS差分信号发送、接收一体的芯片,可以支持400Mbps的LVDS信号。主要参数特性如下:Ø 符合TIA/EIA-644-A标准;Ø >400Mbps(200MHz)
2月10日盘后,光峰科技发布公告,于近日收到某知名车企出具的开发定点通知书,将为其旗下新时代科技品牌的SUV车型供应智能座舱显示产品,预计2025年内量产供货。光峰科技认为,随着消费者对智能座舱需求的
2月11日,特斯拉上海储能超级工厂投产仪式今日在上海临港举行,这一重要项目的投产标志着特斯拉在华业务的进一步拓展。特斯拉上海储能超级工厂于 2024 年 5 月正式在上海临港新片区开工建设。从开工到产
比亚迪放大招,智驾卷到10万元内!王传福:比亚迪全系车型搭载高阶智驾2月10日晚,比亚迪智驾发布会放出“王炸”,这家全球新能源汽车销量冠军宣布,将推出低、中、高三套不同配置高阶智能驾驶解决方案,首批搭
 △广告 与正文无关 近日,南浔区举行项目签约仪式,晶洲长三角TGV玻璃基板半导体工艺装备研发及产业化项目、玻璃基板PVD镀膜设备研发及生产项目签约落户南浔。据悉,苏州晶洲装备科技有限公司是目前国内唯
  电子无尘车间在设计时需要重视多个问题,以确保生产环境的洁净度、生产效率和安全性。以下是需要重视的设计问题,具体随合洁科技电子洁净工程公司一起来了解下吧! &emsp
我是芯片超人花姐,入行20年,有40W+芯片行业粉丝。有很多不方便公开发公众号的,关于芯片买卖、关于资源链接等,我会分享在朋友圈。扫码加我本人微信👇2月15日,芯片超人开年首场芯片大会,2025年AI