在中国先进制程被封锁、算力芯片的峰值性能落后的大背景下,中国应该如何应对挑战呢?唐志敏认为,应该全栈协同,突破算力芯片和系统的关建技术,即需要系统级思维,在限制条件下求全系统的最忧解,不追求芯片峰值性能的绝对领先,通过协同创新、全栈优化,得到领先的性能。

在当前AGI(通用人工智能)时代,算力芯片的发展将面临着巨大的挑战和机遇。一方面随着AI技术的不断进步,人工智能算力需求呈现出爆炸性增长;另一方面未来计算将面临物理极限的挑战,需要从软件、架构和系统层面去创新,突破半导体物理层极限,构建智能、绿色、安全的未来计算。

深圳理工大学算力微电子学院院长唐志敏

在2024国际AIoT生态发展大会上,深圳理工大学算力微电子学院院长唐志敏以“AGI时代的算力芯片”为主题,特别分享了算力芯片发展趋势,以及存在生态挑战与解决之道。

唐志敏首先分享了自己对“算力”这一词的定义。他介绍,实际上“算力”一词是中国自媒体新创的词汇,“算力不仅仅是计算的能力,其另一个含义是什么问题能解算,什么问题不能解算”。他认为,算力应该是“快速计算的能力”,利用可接受的资源、在可接受的时间内,完成某种计算任务的能力。

同时,算力应该用性能来度量,其两种基本表述方式:一是延迟,即完成单个任务所需要的时间;二是吞吐量,即单位时间里完成任务的数量。从度量的角度,算力的评测也非常重要,比如性能评价、社会绩效评估。

唐志敏指出,不恰当的评估方式危害巨大,比如此前过度强调GDP发展会影响环境,“评价是一个很棘手的问题。如果我们评价的方法不好,实际上我们的战略发展可能会误入歧途,或者没有走到正确的道路上去。”因此,最本质的衡量方式是完成计算任务的总时间。

理论上,通过硬件的累加,即运算部件数量*运算部件位宽*时钟频率,就能实现峰值性能。但唐志敏表示,硬件峰值是一个永远也达不到的上限,“没有一个程序能让所有运算部件同时全速运行;实际跑程序的性能,远远低于这个峰值(很可能仅1~5%)”。

高性能计算中运行效率最高的程序是LINPACK,但从上世纪70年代开始,到现在超算上,能达到60~70%的效率。但世界上大部分的应用软件在超级计算机中的效率是远远低于LINPACK,主要原因在于优化不够,比如并行度不够、负载不平衡、数据来回搬运、内存瓶颈等。因此,唐志敏认为,算力看起来是硬件问题,其实是软件问题、应用问题。

他同时指出,人类对计算能力的需求是永无止境的,只是从此前的产品操作计算演进到AI相关类型的计算,“我们还是要不停的探索新的计算能力。”

传统计算主要是科学与工程计算,比如双精度浮点运算(FP64),除了国防军事之外,主要应用在气象预报、油气勘探、工程设计、新药开发等。但随着大数据、人工智能技术的不断发展,比如深度神经网络、大模型,硬件的投入大幅上升,需要通过一些数据优化,来降低硬件的投入成本。

唐志敏表示,CPU是传统的算力芯片,随着进入纳米工艺后,摩尔定律逐渐失效,而AIGC对算力增长的需求却每6个月翻一番(也有3.5个月一说)。2000年Pentium4的主频已经达到4GHz,后来的CPU大部分都低于这个频率,光靠研发性能更好的CPU已经难以满足提升算力的需求。因此,算力需求的大幅上升对异构计算芯片(xPU)

但CPU+XPU的异构计算架构需要做通用性、算力、能耗、成本等方面的平衡,比如图像处理器GPU发展为较通用的加速引擎GPGPU,比如谷歌TPU、各种神经网络NPU、类GPGPU等加速器。不过,唐志敏也指出,异构加速计算的难点在于编程、软件兼容性,比如原来只在CPU上运行的程序,要分为两部分,一部分仍在CPU上,另一部分放到xPU上。因此,这又衍生出算力芯片的生态问题。

那么,什么是算力芯片的生态?应该是能在处理器上运行的各类软件的总和,包括各种应用软件,及支撑应用软件开发运行的系统软件、中间件、库等。比如,CPU的两大典型生态:x86计算机、ARM嵌入式(手机)

唐志敏特别提到,由于嵌入式应用的软件栈不深,RISC-V等其它CPU也有一些机会,但在系统软件、开发环境的完备性方面,跟ARM的差距仍然不小。他也指出,xPU的生态更是个大问题,主要体现在:一是硬件不做动态优化,完全依赖并行软件的优化才能发挥出性能;二是虽然种类很多,用户还是喜欢NV的产品,因为有CUDA。

值得一提的是,尽管兼容CUDA不难,仅需支持一种高级语言,编译器就能搞定,但兼容CUDA生态非常难,甚至可以说一个不可能完成的任务,因其涉及不计其数的库函数,支持数学、科学、工程等领域,都是二进制格式的,同时还涉及构成开发环境的各种工具,基于CUDA平台的各种AI框架、LLM、应用等。

那么,在中国先进制程被封锁、算力芯片的峰值性能落后的大背景下,中国应该如何应对挑战呢?唐志敏认为,应该全栈协同,突破算力芯片和系统的关建技术,即需要系统级思维,在限制条件下求全系统的最忧解,不追求芯片峰值性能的绝对领先,通过协同创新、全栈优化,得到领先的性能。

因此,深圳理工大学成立算力微电子学院,也是希望走一条“另辟蹊径”的道路,基于中国现实的硬件条件,通过全系统的优化,包括设计、工艺、制造协同优化,电路设计与工艺技术结合,芯片微体系结构与电路设计结合,软件设计与硬件结构结合,突破制程制约,实现效能领先的AI应用性能。

在接受电子工程专辑采访时,唐志敏对中美两国的AI技术差距作了相关的解读。他认为,虽然中国在AI芯片技术上相对落后,但可以从应用的角度,推动相关技术的落地,同时强调了软件的优化,以充分发挥AI芯片的性能。

责编:Jimmy.zhang
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
新款开发板售价仅为249美元,而上一代40 TOPS开发板售价为499美元,价格仅为上一代的一半。这使得Jetson Orin Nano Super成为“世界上最经济实惠的生成式AI计算机”,特别适合商业AI开发者、爱好者和学生使用。
近年来,AWS还积极投资于人工智能(AI)、机器学习(ML)、大数据分析和边缘计算等前沿技术,以保持其在这些领域的竞争优势。
这一新规则可能会引起美国在世界各地的合作伙伴和盟友的重大担忧,以及一些国家的不满,担心美国会充当单方面仲裁者,决定谁可以获得对AI至关重要的先进芯片。
谷歌认为,这种独家协议可能会限制市场竞争,导致其他公司无法自由地使用OpenAI的技术,从而增加了用户面临额外成本的风险,比如数据迁移和员工培训等。
有鉴于电动汽车、自动驾驶和人工智能业务等未来增长潜力,以及在马斯克在当选总统特朗普政府中的“特殊地位”,多家分析机构认为,马斯克的财富未来还将进一步增长。
据悉,此次交易是通过马斯克亲自与英伟达CEO黄仁勋进行沟通促成的。这批GB200 AI芯片将被用于强化其旗舰级超级计算集群——Colossus(巨人)。Colossus作为xAI的技术基石,将借此机会实现计算能力的飞跃。
目前,智能终端NFC功能的使用频率越来越高,面对新场景新需求,ITMA多家成员单位一起联合推动iTAP(智能无感接近式协议)标准化项目,预计25年上半年发布1.0标准,通过功能测试、兼容性测试,确保新技术产业应用。
中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案,首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……
C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置,为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。
投身国产浪潮向上而行,英韧科技再获“中国芯”认可
点击蓝字 关注我们安森美(onsemi)在2024年先后推出两款超强功率半导体模块新贵,IGBT模块系列——SPM31 IPM,QDual 3。值得注意的是,背后都提到采用了最新的FS7技术,主要性能
‍‍12月18日,深圳雷曼光电科技股份有限公司(下称“雷曼光电”)与成都辰显光电有限公司(下称“辰显光电”)在成都正式签署战略合作协议。双方将充分发挥各自在技术创新、产品研发等方面的优势,共同推进Mi
投资界传奇人物沃伦·巴菲特,一位94岁的亿万富翁,最近公开了他的遗嘱。其中透露了一个惊人的决定:他计划将自己99.5%的巨额财富捐赠给慈善机构,而只将0.5%留给自己的子女。这引起了大众对于巴菲特家庭
有博主基于曝光的信息绘制了iPhone 17系列渲染图,对比iPhone 16系列,17系列最大变化是采用横置相机模组,背部DECO为条形跑道设计,神似谷歌Pixel 9系列,这是iPhone六年来的
12月18 日,据报道,JNTC与印度Welspun BAPL就车载盖板玻璃的开发及量产签订了投资引进业务合作备忘录(MOU)。资料显示,JNTC是韩国的一家盖板玻璃厂商。Welspun的总部位于印度
万物互联的时代浪潮中,以OLED为代表的新型显示技术,已成为人机交互、智能联结的重要端口。维信诺作为中国OLED赛道的先行者和引领者,凭借自主创新,实现了我国OLED技术的自立自强,成为中国新型显示产
阿里资产显示,随着深圳柔宇显示技术有限公司(下称:“柔宇显示”)旗下资产一拍以流拍告终,二拍将于12月24日开拍,起拍价为9.8亿元。拍卖标的包括位于深圳市龙岗区的12套不动产和一批设备类资产,其中不
近期,高科视像、新视通、江苏善行智能科技等企业持续扩充COB产能。插播:加入LED显示行业群,请加VX:hangjia188■ 高科视像:MLED新型显示面板生产项目(二期)招标12月18日,山西高科
 “ AWS 的收入增长应该会继续加速。 ”作者 | RichardSaintvilus编译 | 华尔街大事件亚马逊公司( NASDAQ:AMZN ) 在当前水平上还有 38% 的上涨空间。这主要得益
亲爱的企业用户和开发者朋友们距离2024 RT-Thread开发者大会正式开幕仅剩最后3天!还没报名的小伙伴,抓紧报名噢,12月21日不见不散!大会时间与地点时间:2024年12月21日 9:30-1