近年来中国智能手机、计算机和服务器市场的火爆,让全行业对GPU的需求逐渐增大。伴随着中国集成电路自给率不断提升,发展国产GPU、提升自给率的呼声不断提高。国产GPU因此走上了快车道,与“老一辈”国产GPU厂商相比,新势力的玩法有哪些不同?技术上又有什么特点呢?

从早期的龙芯到如今大火的RISC-V架构,国产CPU在近年来取得了不错的发展,然而国产GPU的发展相比仍比较落后,直到2014年4月,景嘉微才成功研发出国内首款国产高性能、低功耗GPU。这与GPU本身对CPU的依赖性,以及GPU的研发难度高有关。首先GPU自己的结构中没有控制器,需要CPU调用后才能工作,所以先发展CPU再发展GPU符合芯片产业逻辑;其次行业内GPU的专业工程师和驱动程序开发者比CPU更少,国内就更少了。

但是近年来中国智能手机、计算机和服务器市场的火爆,让全行业对GPU的需求逐渐增大。伴随着中国集成电路自给率不断提升,发展国产GPU、提升自给率的呼声不断提高。国产GPU因此走上了快车道,涌现出沐曦、芯动科技、摩尔线程、壁仞科技等一批新势力,部分厂商获得了大量资本注入。与“老一辈”国产GPU厂商景嘉微、兆芯、龙芯等比较,这些新势力的玩法有哪些不同?技术上又有什么特点呢?

在日前举办的中国集成电路产业设计年会(ICCAD 2021)上,沐曦、芯动科技和芯原股份高层接受了《电子工程专辑》等媒体的采访,除了阐述各自的技术路线特点外,还对国产GPU未来的生态发展发表了意见。

《2021年度中国IC设计调查》开始了!本调查针对中国IC设计公司专业人士进行,包括EDA/IP/IC设计、设计重心与制造工艺、个人发展和工作习惯相关问题四个部分,仅限中国本土IC公司工程师参与,完善信息参与调查将有机会获得最新半导体行业魔法书《观点》! 点击链接参与调查:http://emediasurvey.mikecrm.com/89t6f5q

GPU的技术路线分类

很多人的印象中,GPU就是计算机显卡核心,主要工作是图像处理和输出显示,然而随着AI应用市场的崛起,GPU的用途开始超越图像处理。由于其技术原理适合批量处理特定信息,而且计算能效远超CPU,人们开始将通用计算GPU(GPGPU)用于图形渲染以外的高性能计算,应用场景包括超级计算机、大数据处理和机器学习等。

沐曦高级销售总监王磊

沐曦高级销售总监王磊表示,GPU市场可以笼统地分为两大块,分别是计算和渲染。“其实新的一些渲染场景的增强也对计算部分提出了新的需求,甚至渲染与计算也在进行着密切的融合。沐曦以计算为优先切入点,也是考虑到通用计算、机器学习和AI训练方面迫切的市场需求。下一步,沐曦也将推出渲染GPU,全覆盖高性能GPU市场。”

芯动科技则把GPU赛道分为三类,分别是AI、双精度浮点计算和渲染。芯动科技的赛道切入点是渲染,再向双精度FP64和AI扩展。芯动科技工程副总裁毛鸣明认为,走渲染这条路开始会比较艰难,因为渲染的复杂程度更大,不光包括类似通用计算、GPU里需要的计算核(Unified Shader),还包括图形渲染管线(render pipeline)、前端的顶点着色器(Vertex Shader)、物体几何(Geometry)属性和后端像素着色(Pixel Shader)处理等。

做自家生态,还是跟随行业巨头?

资料显示,沐曦专注于设计针对异构计算等各类应用的高性能通用GPU芯片,产品主要应用方向包含传统GPU及移动应用,人工智能、云计算、数据中心等高性能异构计算领域。

在国产GPU与国外竞品的问题上,王磊认为虽然国货的硬件性能提升速度很快,通过产品迭代门槛已经降低很多,但在不同的客户端或下游市场中,用户担心的往往不是国产GPU性能好不好,而是“好不好用”和“能不能用”。如何让下游客户愿意采用?这是一个生态问题。大部分国产厂商对于生态,都是先做兼容,再考虑自家生态,这对于初创企业来说是比较科学的办法。

除了先做兼容再做生态的方式外,沐曦还采用了梯队型人才建设策略——“从娃娃抓起”。通过在高校做宣讲,让在校生知道公司在做什么样的产品,从人才引导开始构建生态,同时也会在公司内部分场景进行人才建设。

芯动科技是从渲染入手,这个领域的业界标准API有OpenGL(跨平台计算机图形API)、OpenGL ES以及Windows的DirectX,而英伟达一手打造的CUDA生态主要用来做AI和计算,也有图形处理开始用CUDA。“虽然渲染从技术层面来说相对复杂,但好处是接口API标准化。英伟达把自己定义为软件公司,他们也的确建立了非常庞大的围绕CUDA的生态,AI市场则是他们硬生生开辟出来的道路。” 毛鸣明说到。

芯动科技工程副总裁毛鸣明

做传统的渲染GPU在生态上前期投入会相对少一些,因为可以用标准API接口,芯动科技的做法是先支持这些API,然后再在性能上做调优。从这个切入点去进入GPU市场,可以避免一开始就跟非常强大的CUDA生态硬碰硬,或者尝试去兼容CUDA但始终被牵着鼻子走。

毛鸣明还表示,现在国产GPU厂商和许多国外的大厂也很支持Vulkan(低开销、跨平台图像处理API)生态。和OpenGL不一样Vulkan都属于较底层的API标准,可以跟CUDA生态竞争。“Vulkan的发展前景很大,我们希望它不要走OpenGL的老路,有太多的势力参与众口难调最后变成非常庞大复杂的API。”

从IP企业角度看国产GPU生态

作为国产IP第一股的芯原股份,目前是中国第一、全球排名第七的半导体IP供应商,在GPU、DSP等芯片IP授权领域可以排到全球第三。GPU的PC市场已经被英特尔、AMD、英伟达几家垄断,手机移动GPU市场则是高通、Arm、Imagination主导,但在汽车电子、物联网等新兴GPU应用领域,芯原占据了可观的市场份额,也是芯原IP授权重点突破的领域。 芯原在GPU IP上投入多年,如今其可扩展的Vivante GPU IP系列应用范围涵盖从低功耗的小型物联网MCU到面向汽车和计算机应用的SoC。 其中Vivante Nano GPU IP系列具备优化的功耗、性能和面积尺寸和最小的OpenGL ES 3.0和3.1解决方案,适用于物联网应用,还拥有小尺寸矢量图形IP和显示控制IP;最新的Arcturus系列图形和计算IP,则能够满足3D图形渲染和计算所需的最佳功耗、性能、面积需求。

芯原股份(VeriSilicon)创始人、董事长兼总裁戴伟民表示,公司已将智能汽车领域列为公司未来发展战略之一,从智慧座舱到自动驾驶技术均有布局。目前芯原的GPU IP已经在汽车上获得了广泛的应用,包括信息娱乐系统、仪表盘、车身环视、驾驶员状态监控系统、ADAS、自动驾驶汽车等,多家全球知名的汽车OEM厂商都采用了芯原的GPU用于车载信息娱乐系统或是仪表盘。

芯原股份创始人、董事长兼总裁戴伟民

在国产GPU生态问题上,戴伟民介绍了开放标准行业组织科纳斯工业协会(Khronos Group)。2000年成立的Khronos Group是为多媒体处理制定开放标准的行业组织,该协会自成立20多年来,推出过Open GL(跨平台计算机图形API)、Open CL(跨平台通用计算API)、OpenXR(开放虚拟与增强现实标准)以及Vulkan(低开销、跨平台图像处理API)等被业界广泛接受的技术标准库。该组织的董事会成员有两家中国厂商,一家是芯原,另一家是华为。

“介绍Khronos的目的是要告诉大家,除了CUDA以外,还有其他生态可以选择。”戴伟民说到,“但是做GPU要有策略性,选择更好的生态圈实现起来才更容易。”就目前来说,CUDA还是最好的GPU生态;Vulkan光线追踪是业界第一个开放、跨厂商、跨平台的光线追踪加速标准,属于轻量级API,可大幅减少驱动程序,并为程序员提供更多灵活性;OpenCL则是跨供应商的标准API,是第一个面向异构系统通用目的并行编程的开放式、免费标准,也是一个统一的编程环境,支持多核心CPU、GPU、NPU、DSP以及其他并行处理器;OpenXR允许开发人员使用通用的高性能API,可以与任何3D API一起使用;OpenVX是一种开放的,免版税的标准,用于跨平台加速计算机视觉应用程序,可实现性能和功耗优化的计算机视觉处理,这在嵌入式和实时使用情况下尤其重要;SYCL是一种免版税,跨平台的抽象层,它允许使用标准ISO C ++编写异构处理器的代码,并在同一源文件中包含应用程序的主机代码和内核代码。

国产GPU的优势和市场策略

具体到GPU产品,涉及到硬件性能和软件生态,沐曦的优势在于创始团队是一支平均拥有15年以上从高性能GPU设计到量产交付全流程经验的全建制团队。

所以王磊认为,“在产品性能方面,沐曦团队还是比较自信的。”沐曦曾表示其GPU将采用5nm工艺技术,全兼容主流GPU生态,采用原创专利保护的可重构GPU架构,突破传统GPU芯片能效瓶颈;采用数据压缩、数据广播以及共享硬件加速单元等先进技术,大幅度优化核心算力能耗比。

最后是找到能够契合公司产品定位的市场并攻下山头,“就像攻城,要先找一个城防上的小缺口,找到我们擅长的领域和市场,让市场接纳才有机会做进一步迭代。”王磊说到。

芯动科技的市场切入点主要有两个方面:

一是弯道超车,因为元宇宙这类新概念出现后,基于云端的渲染需求出现了爆发式增长,云端渲染是相对较新的赛道,也比较适合芯动科技的GPU架构。芯动瞄准了这条赛道里面更细分的赛道,例如Windows和安卓。虚拟化跟传统市场也存在竞争关系,云上应用越广越多意味着虚拟化越来越普及,这会蚕食GPU的现有应用市场。“如果大家都采用虚拟化,英伟达的显卡销量就会变少,对巨头没有好处的市场他们不会快速推进,所以在虚拟化上我们可以抓住架构上的优势,在生态以点进行突破。” 毛鸣明说到,“另外要把虚拟化做好做稳定难度相当大,要做好用户和用户之间的资源隔离而且在一个用户出故障的时候不能影响其他用户。这是芯动可以做差异化的发力点之一。”

二是在传统应用方面,芯动可以做国产化。当前芯片国产化的呼声很高,只要能够拿出相对有竞争力的产品,国货还是有优势的。毛鸣明列举了几个典型应用,包括桌面和笔记本的入门级显卡、终端上的CAD应用,“有一个立足点就可以迭代,芯动科技在迅速迭代方面比较擅长,只要给我们一个抓手,两到三年的时间就可以慢慢渗透乃至进入这个市场。”

责编:Luffy Liu

本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
这是《2024 Top 80 国产传感器(Sensor)芯片厂商调研分析报告》第七部分:Top 80国产传感器芯片厂商信息汇总,包括80家国产传感器芯片厂商基本信息统计表、厂商画像(公司简介、核心技术、主要产品、目标市场和竞争优势)。
这是《2024 Top 80 国产传感器(Sensor)芯片厂商调研分析报告》第六部分:国产传感器厂商综合排名及对比分析,包括2023 Fabless100排行榜之Top 10传感器公司、传感器类上市公司对比分析。
这是《2024 Top 80 国产传感器(Sensor)芯片厂商调研分析报告》第五部分:传感器新兴应用及方案(Application Solutions),涉及AIoT应用、ADAS/自动驾驶、智能安防。
这是《2024 Top 80 国产传感器(Sensor)芯片厂商调研分析报告》第四部分:传感器最新技术趋势(New Technologies),涉及智能传感器、MEMS、激光雷达、EVS传感器。
作为Fabless100系列分析报告的重要组成部分,AspenCore分析师团队于2022年发布了《60 家国产传感器芯片厂商调查统计报告》,得到了电子和IC设计工程师及业界朋友的极大肯定和支持。2023年,传感器行业和国产传感器芯片厂商也经历了巨大变化。我们在原报告基础上,参考行业权威调研机构的传感器市场数据,汇总整理出2024版《Top 80国产传感器(Sensor)芯片厂商调研分析报告》,希望为业界朋友展现出最新传感器技术和应用发展趋势,以及国产传感器芯片厂商的市场竞争实力。
• 目前,iPhone在翻新市场中是最热门的商品,并将长期主导着翻新机的平均销售价格。 • 全球翻新机市场持续向高端化发展,其平均销售价格(ASP)现已超过新手机。 • 新兴市场是增长的最大驱动力,消费者对高端旗舰产品有着迫切需求。 • 由于市场固化和供应链的一些问题限制推高中国、东南亚和非洲等大市场的价格。 • 2024年,这些翻新机平均销售价格将首次超过新手机。
从全球厂商竞争来看,三季度凭借多个新品发布,石头科技市场份额提升至16.4%,连续两季度排名全球第一……
2025年1月9日,美国 拉斯维加斯丨全球瞩目的国际消费电子产品展(CES 2025)盛大开幕,来自世界各地的科技巨头与创新企业齐聚一堂共同展示最新的科技成果。中国高性能微控制器产品及嵌入式解决方案提供商上海先楫半导体科技有限公司(先楫半导体,HPMicro)闪耀登场,发布了专注于机器人运动与控制的高性能MCU产品——HPM6E8Y系列,为火热的机器人市场注入新的活力。
最新Wi-Fi HaLow片上系统(SoC)为物联网的性能、效率、安全性与多功能性设立新标准,配套USB网关,可轻松实现Wi-Fi HaLow在新建及现有Wi-Fi基础设施中的快速稳健集成
1月8日消息,奥康国际发布公告称,终止发行股份购买资产,公司股票将于1月8日开市起复牌。至此,奥康国际谋划的跨界收购芯片公司事项告一段落。奥康国际在公告中介绍,公司于2024年12月24日披露了《关于
1月7日,据韩媒 sisajournal-e 消息,三星计划 2025 年下半年推出三折叠手机,采用 G 形双内折设计,完全展开后尺寸为 12.4 英寸。据称,有别于华为的 S 形折叠屏方式(In&O
‌‌Jan. 9, 2025 产业洞察根据TrendForce集邦咨询最新研究,随着人型机器人迈向高度系统整合,并有望从工业场景走进家庭生活,前端的AI模型训练将更为关键,以满足更多后端理解与互动需求
点击蓝字 关注我们SUBSCRIBE to USImage: The Verge据悉,OpenAI已经制定了成为一家营利性公司的计划。在近日发布的一篇博客文章中,OpenAI的董事会表示,将把公司现有
日前,国家发展改革委等部门介绍了加力扩围实施“两新”政策有关情况,今年第一批消费品以旧换新资金810亿已经预下达。很多网友没有看懂具体政策,下面快科技给大家简单梳理一下,其实一句话来说就是:国四车、家
近日,闻泰科技在一场电话会议中阐述了其出售ODM(原始设计制造)业务的战略考量。           闻泰科技表示,基于地缘政治环境变化,考虑到 ODM 业务稳健发展和员工未来发展利益最大化,公司对战
  在千级电子净化车间中设置通风系统时,需要综合考虑多个因素,包括洁净度要求、换气次数、气流组织、空气处理、温湿度控制以及节能与环保等。以下是合洁科技电子洁净工程公司的一些具体的设
 △广告 与正文无关 1月3日,The Elec援引电子元件专业媒体内容表示,尽管取代中国PCB的努力仍在继续,但预计到2028年,中国(包括大陆和台湾省)在全球PCB销售中的份额将超过60%,在市场
据彭博社报道,软银集团及其控股子公司 Arm 正在探讨收购 Ampere Computing 的可能。 Ampere Computing 是甲骨文支持的半导体设计公司,致力于塑造云计算的未来,并推出了
1月8日消息,据外媒报道,由于半导体行业需求衰退,日本瑞萨电子将在日本及海外裁员数百人,并且定期加薪也将被推迟!据报道,瑞萨电子在日本和海外有约21,000名员工,本次裁员比例近5%。这一裁员计划已于