在中国先进制程被封锁、算力芯片的峰值性能落后的大背景下,中国应该如何应对挑战呢?唐志敏认为,应该全栈协同,突破算力芯片和系统的关建技术,即需要系统级思维,在限制条件下求全系统的最忧解,不追求芯片峰值性能的绝对领先,通过协同创新、全栈优化,得到领先的性能。

在当前AGI(通用人工智能)时代,算力芯片的发展将面临着巨大的挑战和机遇。一方面随着AI技术的不断进步,人工智能算力需求呈现出爆炸性增长;另一方面未来计算将面临物理极限的挑战,需要从软件、架构和系统层面去创新,突破半导体物理层极限,构建智能、绿色、安全的未来计算。

深圳理工大学算力微电子学院院长唐志敏

在2024国际AIoT生态发展大会上,深圳理工大学算力微电子学院院长唐志敏以“AGI时代的算力芯片”为主题,特别分享了算力芯片发展趋势,以及存在生态挑战与解决之道。

唐志敏首先分享了自己对“算力”这一词的定义。他介绍,实际上“算力”一词是中国自媒体新创的词汇,“算力不仅仅是计算的能力,其另一个含义是什么问题能解算,什么问题不能解算”。他认为,算力应该是“快速计算的能力”,利用可接受的资源、在可接受的时间内,完成某种计算任务的能力。

同时,算力应该用性能来度量,其两种基本表述方式:一是延迟,即完成单个任务所需要的时间;二是吞吐量,即单位时间里完成任务的数量。从度量的角度,算力的评测也非常重要,比如性能评价、社会绩效评估。

唐志敏指出,不恰当的评估方式危害巨大,比如此前过度强调GDP发展会影响环境,“评价是一个很棘手的问题。如果我们评价的方法不好,实际上我们的战略发展可能会误入歧途,或者没有走到正确的道路上去。”因此,最本质的衡量方式是完成计算任务的总时间。

理论上,通过硬件的累加,即运算部件数量*运算部件位宽*时钟频率,就能实现峰值性能。但唐志敏表示,硬件峰值是一个永远也达不到的上限,“没有一个程序能让所有运算部件同时全速运行;实际跑程序的性能,远远低于这个峰值(很可能仅1~5%)”。

高性能计算中运行效率最高的程序是LINPACK,但从上世纪70年代开始,到现在超算上,能达到60~70%的效率。但世界上大部分的应用软件在超级计算机中的效率是远远低于LINPACK,主要原因在于优化不够,比如并行度不够、负载不平衡、数据来回搬运、内存瓶颈等。因此,唐志敏认为,算力看起来是硬件问题,其实是软件问题、应用问题。

他同时指出,人类对计算能力的需求是永无止境的,只是从此前的产品操作计算演进到AI相关类型的计算,“我们还是要不停的探索新的计算能力。”

传统计算主要是科学与工程计算,比如双精度浮点运算(FP64),除了国防军事之外,主要应用在气象预报、油气勘探、工程设计、新药开发等。但随着大数据、人工智能技术的不断发展,比如深度神经网络、大模型,硬件的投入大幅上升,需要通过一些数据优化,来降低硬件的投入成本。

唐志敏表示,CPU是传统的算力芯片,随着进入纳米工艺后,摩尔定律逐渐失效,而AIGC对算力增长的需求却每6个月翻一番(也有3.5个月一说)。2000年Pentium4的主频已经达到4GHz,后来的CPU大部分都低于这个频率,光靠研发性能更好的CPU已经难以满足提升算力的需求。因此,算力需求的大幅上升对异构计算芯片(xPU)

但CPU+XPU的异构计算架构需要做通用性、算力、能耗、成本等方面的平衡,比如图像处理器GPU发展为较通用的加速引擎GPGPU,比如谷歌TPU、各种神经网络NPU、类GPGPU等加速器。不过,唐志敏也指出,异构加速计算的难点在于编程、软件兼容性,比如原来只在CPU上运行的程序,要分为两部分,一部分仍在CPU上,另一部分放到xPU上。因此,这又衍生出算力芯片的生态问题。

那么,什么是算力芯片的生态?应该是能在处理器上运行的各类软件的总和,包括各种应用软件,及支撑应用软件开发运行的系统软件、中间件、库等。比如,CPU的两大典型生态:x86计算机、ARM嵌入式(手机)

唐志敏特别提到,由于嵌入式应用的软件栈不深,RISC-V等其它CPU也有一些机会,但在系统软件、开发环境的完备性方面,跟ARM的差距仍然不小。他也指出,xPU的生态更是个大问题,主要体现在:一是硬件不做动态优化,完全依赖并行软件的优化才能发挥出性能;二是虽然种类很多,用户还是喜欢NV的产品,因为有CUDA。

值得一提的是,尽管兼容CUDA不难,仅需支持一种高级语言,编译器就能搞定,但兼容CUDA生态非常难,甚至可以说一个不可能完成的任务,因其涉及不计其数的库函数,支持数学、科学、工程等领域,都是二进制格式的,同时还涉及构成开发环境的各种工具,基于CUDA平台的各种AI框架、LLM、应用等。

那么,在中国先进制程被封锁、算力芯片的峰值性能落后的大背景下,中国应该如何应对挑战呢?唐志敏认为,应该全栈协同,突破算力芯片和系统的关建技术,即需要系统级思维,在限制条件下求全系统的最忧解,不追求芯片峰值性能的绝对领先,通过协同创新、全栈优化,得到领先的性能。

因此,深圳理工大学成立算力微电子学院,也是希望走一条“另辟蹊径”的道路,基于中国现实的硬件条件,通过全系统的优化,包括设计、工艺、制造协同优化,电路设计与工艺技术结合,芯片微体系结构与电路设计结合,软件设计与硬件结构结合,突破制程制约,实现效能领先的AI应用性能。

在接受电子工程专辑采访时,唐志敏对中美两国的AI技术差距作了相关的解读。他认为,虽然中国在AI芯片技术上相对落后,但可以从应用的角度,推动相关技术的落地,同时强调了软件的优化,以充分发挥AI芯片的性能。

责编:Jimmy.zhang
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
有人评论:AlphaFold-3解决了长距离依赖问题,还能预测RNA等分子结构,甚至细胞内部生化过程,这简直就是生物信息学领域的一场革命。
英国以向俄罗斯军事工业提供支持为由,宣布对多国实体及个人实施制裁,其中包括10家来自中国大陆和香港的企业。
这款芯片不仅适用于AI汽车,还可以应用于AI机器人和未来可能的飞行汽车领域,体现了小鹏在智能化领域的雄心壮志。据悉,图灵AI芯片的算力非常强大,一颗芯片的算力相当于三颗主流智驾芯片。这使得它能够同时驱动自动驾驶系统、智能座舱大模型等多种应用。
汪洋特别提到,第十三届芯原CEO论坛五大预测之一是2028年用于端侧微调卡和推理卡的销售额将超过用于云侧的训练卡。目前,推理和端侧微调也是芯原重点关注的领域,同时也希望在这一发展趋势中寻找新的机遇。 
三星电子的晶圆代工业务亏损重要原因之一是错失HBM风口和尖端制程良率问题。作为全球最大的存储芯片制造商,三星电子巅峰时期曾独占全球45%以上的内存市场。然而,近两年来,三星电子在先进制程芯片及AI芯片领域的进展缓慢。
随着AI相关需求的增加,HBM4预计将在AI服务器、数据中心、汽车驾驶等高性能计算领域得到广泛应用。在强劲的AI技术需求下,英伟达希望通过HBM4来确保其产品能够支持这些快速增长的高带宽需求。
为了更直观地了解FinFET到GAAFET架构世代的差异,本文利用高倍率的电子显微镜影像进行深入的探讨与分析,观察其于结构微观层面上的特征...
汽车技术领域正处于关键的转折点,其未来依托于动态且适应性强的系统,并可通过软件不断提升驾驶体验。
连接标准联盟很高兴宣布 Matter 1.4 现已正式发布,可供设备制造商和生态平台开发应用。这次更新是Matter生态系统迈出的重要一步。Matter 1.4带来了一系列增强功能......
根植雄厚研发实力及物联网领域的深耕实践,汇顶科技面向新兴车载互联应用全力进击。旗下首款高可靠性、高性能车规级低功耗蓝牙SoC——GR5405,已成功通过AEC-Q100 Grade 2认证。
国芯网[原:中国半导体论坛] 振兴国产半导体产业!   不拘中国、放眼世界!关注世界半导体论坛↓↓↓11月12日消息,据路透社看到的草案,日本政府计划提出一个耗资 10 万亿日元的计划,在“数年”时间
近几年,越来越多的中国电子零部件企业将目光投向海外市场,寻求“出海”机会。有一家坐落于深圳龙岗坂田的企业,在高端豪华车、工业控制上的产品成功获得了行业标杆客户的订单,出口额更是突破百万美元,成为“出海
互联网与科技企业每日重点资讯文 | 苏丁巨头动向歌尔股份被曝成为苹果2026年两款新品供应商天风国际分析师郭明錤爆料称,苹果将首次进军智能家居IP Camera(网络摄像头)市场,计划2026年量产,
英国豪华跑车制造商路特斯宣布,由于市场需求变化和市场环境演变,公司将在英国裁员 200 人。上周,路特斯向员工确认了裁员消息,表示公司将尝试重新安置部分员工,并计划探索如何“在企业内部保留特定技能和知
东芝电子今日宣布,最新开发出一款用于车载牵引逆变器[1]的裸片[2]1200 V碳化硅(SiC)MOSFET“X5M007E120”,其创新的结构可实现低导通电阻和高可靠性。X5M007E120现已开
 会 议 预 告  活动倒计时 8 天11月20-21日 | 行家说新型显示全产业链年会近期,点莘技术、秋水半导体、纳视智能、睿励科学仪器等4家Micro LED相关企业相继完成新一轮融资,单笔金额最
中国新能源车市场的变化速度用“日新月异”来形容毫不夸张,短短几年时间,车企们的发力方向就从“冰箱彩电大沙发”的卷配置,到猛堆电池的卷续航,再到蜂拥而上卷智能化。各种方向的技能树都没少点,但由于补能效率
艾默生完成对NI的收购已有一年,NI客户或也许会有这样的疑问——艾默生收购NI意味着什么?如何继续投入测试测量行业?NI如何看待中国市场?在今天举办的NI全联结峰会上,针对这三大关键问题,艾默生测试与
国芯网[原:中国半导体论坛] 振兴国产半导体产业!   不拘中国、放眼世界!关注世界半导体论坛↓↓↓11月12日消息,据台媒报道,继台积电宣布对中国大陆AI芯片企业暂停7nm及以下先进制程代工服务后,