直击!国产GPU的四大难题

原创 半导体产业纵横 2022-05-25 18:00

编者按:自1956年中国将半导体作为国家重要的发展领域后,今年是第66个年头。回望66年的发展,从无到有、从小到大,半导体产业经历了风雨坎坷同时又迸发出无限的生机。在中国“十四五”提出数字经济发展规划,瞄准集成电路等战略性领域之际,半导体产业纵横推出“国产化进程”系列专题,讲述当今中国半导体各领域发展进程,解析国产化最新态势,本期为“国产化进程”专题集成电路篇第三篇文章:GPU。


半导体产业纵横编辑部

近年来,国产GPU频频传出好消息。景嘉微宣布其JM9系列第二款GPU已经完成流片、封装阶段工作。芯动科技在去年底推出一颗“风华1号”,填补了国产4K级桌面显卡和服务器级显卡两大空白。2020年成立的摩尔线程在1年后发布了第一代MUSA系统架构GPU,并可量产交付。壁仞科技也紧跟着宣布首款通用GPU芯片点亮成功。

 

在市场和政策的推动下,曾经蒙尘的国产GPU开始闪烁自己的光芒。这是国产GPU的黄金时代。

 

国产GPU的发展到什么地步?


据Verified Market Research数据显示,2020年中国大陆的独立GPU市场规模为47.39亿美元,预计2027年中国大陆GPU市场规模将超过345.57亿美元。

 

如此广阔的中国市场中,国产GPU的市占比却少的可怜。2019年,中国芯片的自给率仅为30%左右,从中国主要芯片国产化率来看,射频芯片、移动通信终端、模拟芯片、闪存、微控制器、内存、可编辑逻辑器件的国产化率分别为40%、24%、15%、5%、3%、1%、1%。谨慎估计GPU芯片的国产化规模约37亿元。

 

但属于高端芯片的GPU研发却并不容易。Intel一直想踏足高端GPU领域,但仍未成功。英特尔最早的GPU研发可以追溯到 1997 年,英特尔通过收购C&T 获得了 2D 显示核心技术,3D 技术源于拥有 20%股权的 Real3D。但直到2022年4月,Intel仍未推出自己消费级的独立 GPU 产品。


国内GPU究竟达到国际的什么水平?


从国内GPU龙头景嘉微的产品来看,景嘉微在2021年9月推出的JM9231和JM9271将采用业界主流的统一渲染架构,支持 OpenGL4.5接口,可以无缝兼容市面上主流的CPU、操作系统和应用程序。


 

JM9231性能与国际同类公司2016年中低端产品性能相当,主要针对国产化办公电脑,便携式计算机、中低端的游戏机和高端嵌入式系统等消费电子领域。JM9271在JM9231基础上对科学计算能力进行大幅度提高和改进,可以达到国际同类公司2017年中高端产品的性能。

 

可以看出,相较于国际巨头,国内GPU的性能差距还很远。因此对于中国来说,推动GPU的自主研发刻不容缓。

 

国产GPU的黄金时代


尽管国内GPU的发展存在很多问题,但笔者仍然认为现在的时代是国产GPU发展的黄金时代。

 

我们正在进入“一切需要可视化的时代”,这几年市场对于GPU的需求增长极快。可视化需要大量的图形、图像计算能力,无论是云端还是边缘侧都需要大量的高性能图像处理能力。

 

GPU在AI、数据中心领域需求极大。根据IDC数据,2022年全球AI芯片市场将达352亿美元。其中GPU占比最大,Goldman预计到2025年GPU占比将达到57%。

 

GPU巨头英伟达2022年发布的财报中各项经营指标惊人,2022年全年营收269亿美元,相比2021财年增加103亿美元,同比增长61%;净利润97.5亿美元,同比增长122%。不管是营收还是净利润,均创纪录 。

 

无论是客户需求还是供应商的市值变化都在证明——GPU市场正处于火爆时刻。

 

在2006年,国务院颁布了《国家中长期科学和技术发展规划纲要(2006年-2020年)》,“核心电子器件、高端通用芯片及基础软件产品”(简称“核高基重大专项”)位列16个科技重大专项首位,也被称之为“01专项”,国产GPU位列其中。

 

国务院印发《新时期促进集成电路产业和软件产业高质量发展的若干政策》,《若干政策》强调,集成电路产业和软件产业是信息产业的核心,是引领新一轮科技革命和产业变革的关键力量。国务院发布的相关数据显示,中国芯片自给率要在2025年达到70%

 

自2017年以来,多个中国新一代初创型GPU研发公司相继成立,逐渐成为中国GPU历史舞台上的一员。

 

在图形GPU领域,国内以景嘉微、航锦科技等为代表的传统企业为主力。另外,从事CPU研发的企业(如兆芯、龙芯等),也开始切入这个赛道,增强了国内GPU企业的整体研发实力。

 

景嘉微是中国第一家成立的GPU公司,公司产品主要分为图形图像处理系统、小型雷达系统、GPU 芯片,广泛应用于军工行业。公司图形显控领域产品包括图显模块和加固类产品,其中图显模块是核心产品。

 

景嘉微成立当年,恰逢我国军用飞机图形显控系统由使用 DSP 与 FPGA 图形加速器向使用 GPU 图形处理器升级,公司准确把握机遇,将大量资源投入飞机图形显控领域的研究。也正因如此,景嘉微最初是制作军工产品起家。

 

摩尔线程在2020年6月成立,用18个月发布全新统一系统架构MUSA和全能GPU产品“苏堤”等系列新品。其公司创始人兼CEO张建中此前曾任英伟达全球副总裁、中国区总经理,在GPU行业深耕超过15年,带领英伟达开拓建立了GPU在中国的完整的生态系统。

 

沐曦集成电路在2021年完成数亿元PreA+轮融资,融资由两家“国家队”:国调基金、中网投联合领投,联想创投等多家机构跟投。据称这家高性能通用GPU芯片设计公司的创始团队主要来自AMD等国际公司,拥有从40nm到7nm制程GPU芯片的设计和量产经验。

 

芯瞳半导体创始团队来自西邮GPU研发团队,这家专注于计算机图形和高性能计算的芯片设计初创公司将在南京投资1.5亿元,开发高性能、高可靠和高稳定性的国产自主GPU和人工智能芯片。

 

天数智芯自研的一款7纳米GPGPU(通用图形处理器)芯片产品卡——BI成功发布,这是中国第一款全自研且有产品面世的GPGPU的芯片。其首款全自研GPU架构下的7nm云端训练芯片及GPGPU产品卡已亮相,这款芯片采用台积电7nm制程、容纳240亿晶体管及采用2.5DCoWoS晶圆封装技术。

 

国产GPU发展困境


IP授权

 

国产GPU最近一段时间借助IP授权多点开花,纷纷流片成功或量产,算是迈出了艰难的第一步。

 

任何一款高端芯片的打造都离不开IP。一个GPU中行业IP核占用的面积超过了80%。但IP的研发并不轻松,GPU IP自研需要36-48个月以及200个工程师,而采用外购IP的方式,可以减少12-18个月开发周期。

 

芯动科技于去年发布的GPU“风华1号”,其IP购买自英国GPU技术授权公司Imagination。获得架构许可后,芯动科技探索了很多自己的方案,包括自研的Cache一致性Innolink Chiplet技术,内置国产物理不可克隆iUnique Security PUF信息安全加密技术等。因此“风华1号”GPU80%以上的IP都属于自主研发。

 

外购IP加上自研设计非常有利于商业变现,可以快速获得成熟系统和后端版图,同时也有利于快速构建软件栈和底层工业API适配,极大的降低研发周期和风险。如今国内主要的通用计算+图形GPU创业公司,如芯动、摩尔线程、壁仞等等都使用Imagination IP或者芯原授权的IP。但使用IP授权也有缺点,即核心电路专利无法自控和自主迭代。

 

创业热潮下的生产困境

 

随着GPU成为AI计算的必需品,一波GPU创业潮在中国市场兴起。据统计仅2020~2021年,GPGPU领域就有近20起融资事件发生。2018年12月瀚博半导体在上海成立,目前已经完成总计5000万美元的A轮融资;2019年成立的壁仞科技,在2021年3月完成了B轮融资,18月累计融资超过47亿元;同年11月芯瞳半导体成立;2021年,沐曦集成电路宣布完成10亿元人民币A轮融资。

 

但初创之下国产GPU仍然面临生产困难。目前和AI相关的大芯片,因为需要CoWoS等先进封装,所涉及的中介层原材料非常紧缺,在目前产能吃紧的情况下,对于已经推出一些产品的初创GPU企业,会面临短期盈利的问题。

 

并且GPU市场早已被虎视眈眈的英伟达、AMD包围,中国GPU芯片初创公司需要和这些拥有技术、经济实力的巨头竞争,必然是处于劣势。

 

成本难降,量产数量少

 

芯片量产前还要经历冗长的设计测试流程。通常一款高端芯片前端和后端设计要耗1~3年,设计完成后流片环节需要3~6个月,期间还会有流片失败一切重来的风险。即使成功流片,还需经过3~12个月的产品测试调优,才能开启量产。

 

因此尽管越来越多的GPU厂商涌入,但阵阵喧闹过后,市场上仍未见可与国际巨头对标的量产产品。

 

国内GPU生态突围

 

此外,对于国产GPU来说,产品如何实现规模化商用,搭建国产GPU生态同样是一个难题。芯片的成功和成熟需要大量的验证和出货,而找到可持续的落地场景才是长期发展的关键驱动力。

 

ICViews采访业内人士其表示:“目前国产GPU在相同性能下,价格更贵。同时,由于英伟达等国外龙头推出GPU时间更长,长期使用国外GPU的厂商出于惯性也不会突然更换国产GPU。”

 

尚未成熟的GPU在搭建国内生态上也捉襟见肘。

 

风口之下,国产GPU如何发展?


GPU是一个高技术含量的赛道,而且我国在这一领域发展已经落后许久。尽管近年来突然开始有不少初创公司踏足GPU领域,并受到资本青睐,但我国想要彻底打破GPU垄断并不是一件易事。

 

GPU 设计是一项系统工程,包含硬件架构、算法、软件生态等多个组成,缺一不可。从GPU的发展历程来看,GPU单芯片算力增长速度超过CPU,在算力竞争上,GPU也比CPU更胜一筹。

 

沐曦集成电路CEO陈维良曾表示:“全球高性能GPU市场被国外公司垄断,核心算力芯片受制于人,国家安全以及国计民生存在巨大的不可控风险,国产替代势在必行。”


在市场、政策的推动下,国产GPU百花齐放,这将是国产GPU最好的时代。







半导体产业纵横 (微信号: ICViews)半导体产业纵横是神州数码数智创新+平台下的自媒体账号,立足产业视角,提供及时、专业、深度的前沿洞见、技术速递、趋势解析,赋能中国半导体产业,我们一直在路上。
评论
  • 全球知名半导体制造商ROHM Co., Ltd.(以下简称“罗姆”)宣布与Taiwan Semiconductor Manufacturing Company Limited(以下简称“台积公司”)就车载氮化镓功率器件的开发和量产事宜建立战略合作伙伴关系。通过该合作关系,双方将致力于将罗姆的氮化镓器件开发技术与台积公司业界先进的GaN-on-Silicon工艺技术优势结合起来,满足市场对高耐压和高频特性优异的功率元器件日益增长的需求。氮化镓功率器件目前主要被用于AC适配器和服务器电源等消费电子和
    电子资讯报 2024-12-10 17:09 84浏览
  • 【萤火工场CEM5826-M11测评】OLED显示雷达数据本文结合之前关于串口打印雷达监测数据的研究,进一步扩展至 OLED 屏幕显示。该项目整体分为两部分: 一、框架显示; 二、数据采集与填充显示。为了减小 MCU 负担,采用 局部刷新 的方案。1. 显示框架所需库函数 Wire.h 、Adafruit_GFX.h 、Adafruit_SSD1306.h . 代码#include #include #include #include "logo_128x64.h"#include "logo_
    无垠的广袤 2024-12-10 14:03 69浏览
  • 我的一台很多年前人家不要了的九十年代SONY台式组合音响,接手时只有CD功能不行了,因为不需要,也就没修,只使用收音机、磁带机和外接信号功能就够了。最近五年在外地,就断电闲置,没使用了。今年9月回到家里,就一个劲儿地忙着收拾家当,忙了一个多月,太多事啦!修了电气,清理了闲置不用了的电器和电子,就是一个劲儿地扔扔扔!几十年的“工匠式”收留收藏,只能断舍离,拆解不过来的了。一天,忽然感觉室内有股臭味,用鼻子的嗅觉功能朝着臭味重的方向寻找,觉得应该就是这台组合音响?怎么会呢?这无机物的东西不会腐臭吧?
    自做自受 2024-12-10 16:34 136浏览
  • 概述 通过前面的研究学习,已经可以在CycloneVGX器件中成功实现完整的TDC(或者说完整的TDL,即延时线),测试结果也比较满足,解决了超大BIN尺寸以及大量0尺寸BIN的问题,但是还是存在一些之前系列器件还未遇到的问题,这些问题将在本文中进行详细描述介绍。 在五代Cyclone器件内部系统时钟受限的情况下,意味着大量逻辑资源将被浪费在于实现较大长度的TDL上面。是否可以找到方法可以对此前TDL的长度进行优化呢?本文还将探讨这个问题。TDC前段BIN颗粒堵塞问题分析 将延时链在逻辑中实现后
    coyoo 2024-12-10 13:28 101浏览
  • 时源芯微——RE超标整机定位与解决详细流程一、 初步测量与问题确认使用专业的电磁辐射测量设备,对整机的辐射发射进行精确测量。确认是否存在RE超标问题,并记录超标频段和幅度。二、电缆检查与处理若存在信号电缆:步骤一:拔掉所有信号电缆,仅保留电源线,再次测量整机的辐射发射。若测量合格:判定问题出在信号电缆上,可能是电缆的共模电流导致。逐一连接信号电缆,每次连接后测量,定位具体哪根电缆或接口导致超标。对问题电缆进行处理,如加共模扼流圈、滤波器,或优化电缆布局和屏蔽。重新连接所有电缆,再次测量
    时源芯微 2024-12-11 17:11 65浏览
  • 天问Block和Mixly是两个不同的编程工具,分别在单片机开发和教育编程领域有各自的应用。以下是对它们的详细比较: 基本定义 天问Block:天问Block是一个基于区块链技术的数字身份验证和数据交换平台。它的目标是为用户提供一个安全、去中心化、可信任的数字身份验证和数据交换解决方案。 Mixly:Mixly是一款由北京师范大学教育学部创客教育实验室开发的图形化编程软件,旨在为初学者提供一个易于学习和使用的Arduino编程环境。 主要功能 天问Block:支持STC全系列8位单片机,32位
    丙丁先生 2024-12-11 13:15 45浏览
  • 一、SAE J1939协议概述SAE J1939协议是由美国汽车工程师协会(SAE,Society of Automotive Engineers)定义的一种用于重型车辆和工业设备中的通信协议,主要应用于车辆和设备之间的实时数据交换。J1939基于CAN(Controller Area Network)总线技术,使用29bit的扩展标识符和扩展数据帧,CAN通信速率为250Kbps,用于车载电子控制单元(ECU)之间的通信和控制。小北同学在之前也对J1939协议做过扫盲科普【科普系列】SAE J
    北汇信息 2024-12-11 15:45 68浏览
  • 习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-10 16:13 105浏览
  • RK3506 是瑞芯微推出的MPU产品,芯片制程为22nm,定位于轻量级、低成本解决方案。该MPU具有低功耗、外设接口丰富、实时性高的特点,适合用多种工商业场景。本文将基于RK3506的设计特点,为大家分析其应用场景。RK3506核心板主要分为三个型号,各型号间的区别如下图:​图 1  RK3506核心板处理器型号场景1:显示HMIRK3506核心板显示接口支持RGB、MIPI、QSPI输出,且支持2D图形加速,轻松运行QT、LVGL等GUI,最快3S内开
    万象奥科 2024-12-11 15:42 65浏览
  • 智能汽车可替换LED前照灯控制运行的原理涉及多个方面,包括自适应前照灯系统(AFS)的工作原理、传感器的应用、步进电机的控制以及模糊控制策略等。当下时代的智能汽车灯光控制系统通过车载网关控制单元集中控制,表现特殊点的有特斯拉,仅通过前车身控制器,整个系统就包括了灯光旋转开关、车灯变光开关、左LED前照灯总成、右LED前照灯总成、转向柱电子控制单元、CAN数据总线接口、组合仪表控制单元、车载网关控制单元等器件。变光开关、转向开关和辅助操作系统一般连为一体,开关之间通过内部线束和转向柱装置连接为多,
    lauguo2013 2024-12-10 15:53 78浏览
  • 近日,搭载紫光展锐W517芯片平台的INMO GO2由影目科技正式推出。作为全球首款专为商务场景设计的智能翻译眼镜,INMO GO2 以“快、准、稳”三大核心优势,突破传统翻译产品局限,为全球商务人士带来高效、自然、稳定的跨语言交流体验。 INMO GO2内置的W517芯片,是紫光展锐4G旗舰级智能穿戴平台,采用四核处理器,具有高性能、低功耗的优势,内置超微高集成技术,采用先进工艺,计算能力相比同档位竞品提升4倍,强大的性能提供更加多样化的应用场景。【视频见P盘链接】 依托“
    紫光展锐 2024-12-11 11:50 44浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦