CPU被卡脖子之后,国产GPU这条路能走通吗?

电子工程世界 2022-12-28 07:30

根据技术市场研究机构Jon Peddie Research的一份新报告,中国的GPU初创企业数量非同寻常,因为该国试图获得人工智能的优势以及半导体主权。


随着人工智能(AI)、高性能计算(HPC)和图形处理的需求以前所未有的速度增长,近年来全球GPU制造商的数量也在增长。谈到个人电脑的独立显卡,AMD和Nvidia保持领先,而英特尔正在努力追赶。

在上世纪八九十年代,全球一度有多达数十家公司在开发了显卡和独立图形处理器,但为了在3D游戏中获得最高性能而进行的残酷竞争,其中绝大多数公司被淘汰。

到大约2010年时,只有AMD和Nvidia能够为游戏和计算提供有竞争力的独立GPU,而其他公司则专注于集成GPU或GPU IP。

从2015年左右开始,中国的PC GPU开发商数量开始迅速增加,这得益于中国对技术自给自足的推动,以及AI和高性能计算作为高科技大趋势的出现。

根据Jon Peddie Research的数据,目前总共有18家公司在开发和生产GPU。有两家公司主要针对智能手机和笔记本电脑开发SoC绑定的GPU,有6家开发GPU IP,有11家GPU开发商专注于PC和数据中心的GPU,包括AMD、英特尔和英伟达。

事实上,如果在名单中加入其他中国公司,如壁仞科技和天枢智信,那么GPU企业数量将更多。不过,壁仞科技和天枢智信目前只专注于AI和高性能计算,所以JPR不认为他们是传统意义上的GPU开发商。

中国的技术救国之路:GPU开发


作为世界第二大经济体,中国不可避免地与美国和其他发达的国家在几乎所有方面进行竞争。中国竭尽所能地吸引世界各地的工程师。

事实上,在中国,每年都有数百家新的IC设计公司成立。他们开发的产品种类繁多,从微小的传感器到复杂的通信芯片均由涉猎,力图实现对西方国家供应商的自给自足。

但要真正跳上人工智能和高性能计算的浪潮,需要CPU、GPU和特殊用途的计算加速技术。

谈到CPU,中国面临美国在制造设备和技术上的越来越严密的技术封锁,不可能很快赶上全球先进水平。然而在另一个赛道上,可以说,开发和生产一款像样的GPU,比试图造出一款有竞争力的CPU更容易出成果。

「对于中国公司来说,人工智能训练是自主研发GPU的主要驱动力,一方面是因为英伟达的GPU太贵了,另外也是出于对自给自足的渴望。」JPR的负责人Jon Peddie说。

GPU本质上是并行设备,其内部有大量的计算单元可以用于冗余,这使得GPU更容易启动和运行,单位晶体管的成本相对较低,整体产量也不错。此外,GPU的并行性质使其更容易以扩展的方式实现部署。

与CPU相比,GPU在设计和制造上对制程工艺的要求没有那么苛刻,即使目前中国最先进的芯片制造商中芯国际并没有像台积电那样先进的生产工艺,仍然可以利用GPU性能扩展的方式实现足够可观的性能。

事实上,即使中国的GPU开发商失去了使用台积电先进节点(N7及以下)的机会,至少他们中的一些人仍然可以在中芯国际生产更简单的GPU设计,并满足AI、HPC和部分游戏/娱乐市场的需求。

而且,从国家的角度来看,具有AI和HPC能力的GPU可能也可以说比CPU更重要,因为AI和HPC可以实现全新的应用,如自动驾驶汽车和智能城市等应用。

尽管美国政府大力限制向中国出口以超级计算机为基础的CPU和GPU,但比起CPU,GPU在设计和制造上的相对较低的门槛,使得这种限制的效果远没有CPU来的明显 。

GPU微架构相对容易,硬件设计却很昂贵


不过,应该注意的是,虽然目前有很多GPU开发商,但只有两家能真正为PC打造有竞争力的独立GPU。这也许是因为,开发一个GPU架构相对容易,但要正确实现它并设计适当的驱动程序确实很难。

CPU和GPU微架构基本上是「科学和艺术的交汇」。这些架构是一组复杂的算法,开发这些架构的团队规模可能相当小,但可能需要长达几年的时间。

可以这么理解,微架构是在餐巾纸和白板上完成的。至于成本,如果只是架构师自己,团队规模可以只有一个人,也许是三四个人。但是任何类型的建筑,建筑、火箭飞船、网络或处理器都是一个复杂的棋局。

比如,试图预测五年后的制造工艺和标准,性价比的权衡,增加什么功能,放弃或忽略什么功能,这些都是非常棘手和耗时的工作。

架构师们花了很多时间在头脑中进行假设,比如如果把缓存做大25%,如果有6000个FPU,是否应该做一个PCIe 5.0 I/O总线?这么做能不能按时完成?诸如此类。

由于微架构的开发可能需要数年时间,而且需要有才华的设计师,在这个上市时间至关重要的世界里,许多公司就干脆从Arm或Imagination Technologies等公司授权使用现成的微架构,或者是是经过验证的GPU IP。

例如,中国的芯动科技(Innosilicon)就从英国的Imagination公司授权GPU微架构IP用于其Fantasy GPU。

还有一家中国的GPU开发商,使用了Imagination的PowerVR架构。同时,另一家GPU制造商兆芯(Zhaoxin)使用的是Via Technologies获得的GPU微架构。

开发一个微架构的成本可能有所不同,但与现代高端GPU的物理实现成本相比,它的开发成本相对较低。

多年来,苹果和英特尔这两家拥有大量工程人才的公司都依赖Img进行GPU设计。联发科和其他小型SoC供应商依靠Arm。高通公司在很长一段时间内使用ATI/AMD,而三星在尝试设计自己的图形引擎数年后,也转向了AMD。

最近,两家新的中国GPU公司聘请了前AMD和英伟达的架构师,另外两家使用Img。进入市场的时间和学习作为一个架构师的技能,要担心什么,以及如何找到解决方法,是一个非常耗时的过程。

「如果你能去找一家已经有了设计方案,并且已经设计了很长时间的公司,可以节省大量的时间和金钱,而在市场上,时间就是一切。」

「这个过程中会有太多的问题。并非每一个由AMD或英伟达设计的GPU都能成为赢家。不过,一套好的架构设计可以经历几代的调整,慢慢进步。」研究机构Jon Peddie Research的负责人表示。

对于新的生产制程来说,硬件实现和软件开发的成本太高了。据《国际商业时报》估计,使用5nm级技术制造的设备,其设计成本超过5.4亿美元。如果制程为3nm,设计成本还将增加3倍。

「如果将布局和平面图、模拟、验证和驱动程序全部考虑在内,GPU开发的成本和时间就会激增。」Peddie解释说。

「硬件设计和布局是非常直接的:如果弄错一条线,可能要花几个月的时间来查错。」

目前,世界上只有少数几家公司能够开发出具有AMD和英伟达级别的现代游戏或计算用GPU(460亿-800亿个晶体管规模)芯片。

不过,前不久中国的壁仞科技发布的BR104和BR100也达到了几乎类似的水平。(据猜测,BR104包含大约385亿个晶体管)。

目前,全球11个PC/数据中心GPU设计供应商中的8个来自中国,这本身就说明了问题。

也许在不久的将来,除了美国公司,我们不会看到有竞争力的独立游戏GPU。中国是否能推出有竞争力的竞争对手,目前还有待观察。

来源:新智元 参考资料:

https://www.tomshardware.com/news/ai-and-tech-sovereignity-drive-number-of-gpu-developers-in-china

https://mms.businesswire.com/media/20221220005263/en/1669467/1/Sample_GPU_Developments_2022_V1.pdf


推荐阅读

566家销售过亿!魏少军:中国集成电路设计产业仍处于高速增长阶段
万元级VR设备拆解及BOM成本分析,到底贵在哪?
欧洲加入全球芯片产业竞争,其实力究竟如何?
寒流来袭,半导体厂商扎堆裁员

添加微信回复“进群”

拉你进技术交流群!

国产芯|汽车电子|物联网|新能源|电源|工业|嵌入式…..  

众号内回复您想搜索的任意内容,如问题关键字、技术名词、bug代码等,就能轻松获得与之相关的专业技术内容反馈。快去试试吧!

如果您想经常看到我们的文章,可以进入我们的主页,点击屏幕右上角“三个小点”,点击“设为星标”。
欢迎扫码关注


电子工程世界 关注EEWORLD电子工程世界,即时参与讨论电子工程世界最火话题,抢先知晓电子工程业界资讯。
评论
  • 遇到部分串口工具不支持1500000波特率,这时候就需要进行修改,本文以触觉智能RK3562开发板修改系统波特率为115200为例,介绍瑞芯微方案主板Linux修改系统串口波特率教程。温馨提示:瑞芯微方案主板/开发板串口波特率只支持115200或1500000。修改Loader打印波特率查看对应芯片的MINIALL.ini确定要修改的bin文件#查看对应芯片的MINIALL.ini cat rkbin/RKBOOT/RK3562MINIALL.ini修改uart baudrate参数修改以下目
    Industio_触觉智能 2024-12-03 11:28 109浏览
  • 当前,智能汽车产业迎来重大变局,随着人工智能、5G、大数据等新一代信息技术的迅猛发展,智能网联汽车正呈现强劲发展势头。11月26日,在2024紫光展锐全球合作伙伴大会汽车电子生态论坛上,紫光展锐与上汽海外出行联合发布搭载紫光展锐A7870的上汽海外MG量产车型,并发布A7710系列UWB数字钥匙解决方案平台,可应用于数字钥匙、活体检测、脚踢雷达、自动泊车等多种智能汽车场景。 联合发布量产车型,推动汽车智能化出海紫光展锐与上汽海外出行达成战略合作,联合发布搭载紫光展锐A7870的量产车型
    紫光展锐 2024-12-03 11:38 126浏览
  • 11-29学习笔记11-29学习笔记习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-02 23:58 92浏览
  • 作为优秀工程师的你,已身经百战、阅板无数!请先醒醒,新的项目来了,这是一个既要、又要、还要的产品需求,ARM核心板中一个处理器怎么能实现这么丰富的外围接口?踌躇之际,你偶阅此文。于是,“潘多拉”的魔盒打开了!没错,USB资源就是你打开新世界得钥匙,它能做哪些扩展呢?1.1  USB扩网口通用ARM处理器大多带两路网口,如果项目中有多路网路接口的需求,一般会选择在主板外部加交换机/路由器。当然,出于成本考虑,也可以将Switch芯片集成到ARM核心板或底板上,如KSZ9897、
    万象奥科 2024-12-03 10:24 93浏览
  • 《高速PCB设计经验规则应用实践》+PCB绘制学习与验证读书首先看目录,我感兴趣的是这一节;作者在书中列举了一条经典规则,然后进行详细分析,通过公式推导图表列举说明了传统的这一规则是受到电容加工特点影响的,在使用了MLCC陶瓷电容后这一条规则已经不再实用了。图书还列举了高速PCB设计需要的专业工具和仿真软件,当然由于篇幅所限,只是介绍了一点点设计步骤;我最感兴趣的部分还是元件布局的经验规则,在这里列举如下:在这里,演示一下,我根据书本知识进行电机驱动的布局:这也算知行合一吧。对于布局书中有一句:
    wuyu2009 2024-11-30 20:30 142浏览
  • 艾迈斯欧司朗全新“样片申请”小程序,逾160种LED、传感器、多芯片组合等产品样片一触即达。轻松3步完成申请,境内免费包邮到家!本期热荐性能显著提升的OSLON® Optimal,GF CSSRML.24ams OSRAM 基于最新芯片技术推出全新LED产品OSLON® Optimal系列,实现了显著的性能升级。该系列提供五种不同颜色的光源选项,包括Hyper Red(660 nm,PDN)、Red(640 nm)、Deep Blue(450 nm,PDN)、Far Red(730 nm)及Ho
    艾迈斯欧司朗 2024-11-29 16:55 186浏览
  • 光伏逆变器是一种高效的能量转换设备,它能够将光伏太阳能板(PV)产生的不稳定的直流电压转换成与市电频率同步的交流电。这种转换后的电能不仅可以回馈至商用输电网络,还能供独立电网系统使用。光伏逆变器在商业光伏储能电站和家庭独立储能系统等应用领域中得到了广泛的应用。光耦合器,以其高速信号传输、出色的共模抑制比以及单向信号传输和光电隔离的特性,在光伏逆变器中扮演着至关重要的角色。它确保了系统的安全隔离、干扰的有效隔离以及通信信号的精准传输。光耦合器的使用不仅提高了系统的稳定性和安全性,而且由于其低功耗的
    晶台光耦 2024-12-02 10:40 143浏览
  • TOF多区传感器: ND06   ND06是一款微型多区高集成度ToF测距传感器,其支持24个区域(6 x 4)同步测距,测距范围远达5m,具有测距范围广、精度高、测距稳定等特点。适用于投影仪的无感自动对焦和梯形校正、AIoT、手势识别、智能面板和智能灯具等多种场景。                 如果用ND06进行手势识别,只需要经过三个步骤: 第一步&
    esad0 2024-12-04 11:20 103浏览
  • RDDI-DAP错误通常与调试接口相关,特别是在使用CMSIS-DAP协议进行嵌入式系统开发时。以下是一些可能的原因和解决方法: 1. 硬件连接问题:     检查调试器(如ST-Link)与目标板之间的连接是否牢固。     确保所有必要的引脚都已正确连接,没有松动或短路。 2. 电源问题:     确保目标板和调试器都有足够的电源供应。     检查电源电压是否符合目标板的规格要求。 3. 固件问题: &n
    丙丁先生 2024-12-01 17:37 114浏览
  • 概述 说明(三)探讨的是比较器一般带有滞回(Hysteresis)功能,为了解决输入信号转换速率不够的问题。前文还提到,即便使能滞回(Hysteresis)功能,还是无法解决SiPM读出测试系统需要解决的问题。本文在说明(三)的基础上,继续探讨为SiPM读出测试系统寻求合适的模拟脉冲检出方案。前四代SiPM使用的高速比较器指标缺陷 由于前端模拟信号属于典型的指数脉冲,所以下降沿转换速率(Slew Rate)过慢,导致比较器检出出现不必要的问题。尽管比较器可以使能滞回(Hysteresis)模块功
    coyoo 2024-12-03 12:20 170浏览
  •         温度传感器的精度受哪些因素影响,要先看所用的温度传感器输出哪种信号,不同信号输出的温度传感器影响精度的因素也不同。        现在常用的温度传感器输出信号有以下几种:电阻信号、电流信号、电压信号、数字信号等。以输出电阻信号的温度传感器为例,还细分为正温度系数温度传感器和负温度系数温度传感器,常用的铂电阻PT100/1000温度传感器就是正温度系数,就是说随着温度的升高,输出的电阻值会增大。对于输出
    锦正茂科技 2024-12-03 11:50 141浏览
  • 学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&
    youyeye 2024-11-30 14:30 85浏览
  • 戴上XR眼镜去“追龙”是种什么体验?2024年11月30日,由上海自然博物馆(上海科技馆分馆)与三湘印象联合出品、三湘印象旗下观印象艺术发展有限公司(下简称“观印象”)承制的《又见恐龙》XR嘉年华在上海自然博物馆重磅开幕。该体验项目将于12月1日正式对公众开放,持续至2025年3月30日。双向奔赴,恐龙IP撞上元宇宙不久前,上海市经济和信息化委员会等部门联合印发了《上海市超高清视听产业发展行动方案》,特别提到“支持博物馆、主题乐园等场所推动超高清视听技术应用,丰富线下文旅消费体验”。作为上海自然
    电子与消费 2024-11-30 22:03 107浏览
  • 最近几年,新能源汽车愈发受到消费者的青睐,其销量也是一路走高。据中汽协公布的数据显示,2024年10月,新能源汽车产销分别完成146.3万辆和143万辆,同比分别增长48%和49.6%。而结合各家新能源车企所公布的销量数据来看,比亚迪再度夺得了销冠宝座,其10月新能源汽车销量达到了502657辆,同比增长66.53%。众所周知,比亚迪是新能源汽车领域的重要参与者,其一举一动向来为外界所关注。日前,比亚迪汽车旗下品牌方程豹汽车推出了新车方程豹豹8,该款车型一上市就迅速吸引了消费者的目光,成为SUV
    刘旷 2024-12-02 09:32 138浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦