从早期的龙芯到如今大火的RISC-V架构,国产CPU在近年来取得了不错的发展,然而国产GPU的发展相比仍比较落后,直到2014年4月,景嘉微才成功研发出国内首款国产高性能、低功耗GPU。这与GPU本身对CPU的依赖性,以及GPU的研发难度高有关。首先GPU自己的结构中没有控制器,需要CPU调用后才能工作,所以先发展CPU再发展GPU符合芯片产业逻辑;其次行业内GPU的专业工程师和驱动程序开发者比CPU更少,国内就更少了。
但是近年来中国智能手机、计算机和服务器市场的火爆,让全行业对GPU的需求逐渐增大。伴随着中国集成电路自给率不断提升,发展国产GPU、提升自给率的呼声不断提高。国产GPU因此走上了快车道,涌现出沐曦、芯动科技、摩尔线程、壁仞科技等一批新势力,部分厂商获得了大量资本注入。与“老一辈”国产GPU厂商景嘉微、兆芯、龙芯等比较,这些新势力的玩法有哪些不同?技术上又有什么特点呢?
在日前举办的中国集成电路产业设计年会(ICCAD 2021)上,沐曦、芯动科技和芯原股份高层接受了《电子工程专辑》等媒体的采访,除了阐述各自的技术路线特点外,还对国产GPU未来的生态发展发表了意见。
《2021年度中国IC设计调查》开始了!本调查针对中国IC设计公司专业人士进行,包括EDA/IP/IC设计、设计重心与制造工艺、个人发展和工作习惯相关问题四个部分,仅限中国本土IC公司工程师参与,完善信息参与调查将有机会获得最新半导体行业魔法书《观点》! 点击链接参与调查:http://emediasurvey.mikecrm.com/89t6f5q
GPU的技术路线分类
很多人的印象中,GPU就是计算机显卡核心,主要工作是图像处理和输出显示,然而随着AI应用市场的崛起,GPU的用途开始超越图像处理。由于其技术原理适合批量处理特定信息,而且计算能效远超CPU,人们开始将通用计算GPU(GPGPU)用于图形渲染以外的高性能计算,应用场景包括超级计算机、大数据处理和机器学习等。
沐曦高级销售总监王磊
沐曦高级销售总监王磊表示,GPU市场可以笼统地分为两大块,分别是计算和渲染。“其实新的一些渲染场景的增强也对计算部分提出了新的需求,甚至渲染与计算也在进行着密切的融合。沐曦以计算为优先切入点,也是考虑到通用计算、机器学习和AI训练方面迫切的市场需求。下一步,沐曦也将推出渲染GPU,全覆盖高性能GPU市场。”
芯动科技则把GPU赛道分为三类,分别是AI、双精度浮点计算和渲染。芯动科技的赛道切入点是渲染,再向双精度FP64和AI扩展。芯动科技工程副总裁毛鸣明认为,走渲染这条路开始会比较艰难,因为渲染的复杂程度更大,不光包括类似通用计算、GPU里需要的计算核(Unified Shader),还包括图形渲染管线(render pipeline)、前端的顶点着色器(Vertex Shader)、物体几何(Geometry)属性和后端像素着色(Pixel Shader)处理等。
做自家生态,还是跟随行业巨头?
资料显示,沐曦专注于设计针对异构计算等各类应用的高性能通用GPU芯片,产品主要应用方向包含传统GPU及移动应用,人工智能、云计算、数据中心等高性能异构计算领域。
在国产GPU与国外竞品的问题上,王磊认为虽然国货的硬件性能提升速度很快,通过产品迭代门槛已经降低很多,但在不同的客户端或下游市场中,用户担心的往往不是国产GPU性能好不好,而是“好不好用”和“能不能用”。如何让下游客户愿意采用?这是一个生态问题。大部分国产厂商对于生态,都是先做兼容,再考虑自家生态,这对于初创企业来说是比较科学的办法。
除了先做兼容再做生态的方式外,沐曦还采用了梯队型人才建设策略——“从娃娃抓起”。通过在高校做宣讲,让在校生知道公司在做什么样的产品,从人才引导开始构建生态,同时也会在公司内部分场景进行人才建设。
芯动科技是从渲染入手,这个领域的业界标准API有OpenGL(跨平台计算机图形API)、OpenGL ES以及Windows的DirectX,而英伟达一手打造的CUDA生态主要用来做AI和计算,也有图形处理开始用CUDA。“虽然渲染从技术层面来说相对复杂,但好处是接口API标准化。英伟达把自己定义为软件公司,他们也的确建立了非常庞大的围绕CUDA的生态,AI市场则是他们硬生生开辟出来的道路。” 毛鸣明说到。
芯动科技工程副总裁毛鸣明
做传统的渲染GPU在生态上前期投入会相对少一些,因为可以用标准API接口,芯动科技的做法是先支持这些API,然后再在性能上做调优。从这个切入点去进入GPU市场,可以避免一开始就跟非常强大的CUDA生态硬碰硬,或者尝试去兼容CUDA但始终被牵着鼻子走。
毛鸣明还表示,现在国产GPU厂商和许多国外的大厂也很支持Vulkan(低开销、跨平台图像处理API)生态。和OpenGL不一样Vulkan都属于较底层的API标准,可以跟CUDA生态竞争。“Vulkan的发展前景很大,我们希望它不要走OpenGL的老路,有太多的势力参与众口难调最后变成非常庞大复杂的API。”
从IP企业角度看国产GPU生态
作为国产IP第一股的芯原股份,目前是中国第一、全球排名第七的半导体IP供应商,在GPU、DSP等芯片IP授权领域可以排到全球第三。GPU的PC市场已经被英特尔、AMD、英伟达几家垄断,手机移动GPU市场则是高通、Arm、Imagination主导,但在汽车电子、物联网等新兴GPU应用领域,芯原占据了可观的市场份额,也是芯原IP授权重点突破的领域。 芯原在GPU IP上投入多年,如今其可扩展的Vivante GPU IP系列应用范围涵盖从低功耗的小型物联网MCU到面向汽车和计算机应用的SoC。 其中Vivante Nano GPU IP系列具备优化的功耗、性能和面积尺寸和最小的OpenGL ES 3.0和3.1解决方案,适用于物联网应用,还拥有小尺寸矢量图形IP和显示控制IP;最新的Arcturus系列图形和计算IP,则能够满足3D图形渲染和计算所需的最佳功耗、性能、面积需求。
芯原股份(VeriSilicon)创始人、董事长兼总裁戴伟民表示,公司已将智能汽车领域列为公司未来发展战略之一,从智慧座舱到自动驾驶技术均有布局。目前芯原的GPU IP已经在汽车上获得了广泛的应用,包括信息娱乐系统、仪表盘、车身环视、驾驶员状态监控系统、ADAS、自动驾驶汽车等,多家全球知名的汽车OEM厂商都采用了芯原的GPU用于车载信息娱乐系统或是仪表盘。
芯原股份创始人、董事长兼总裁戴伟民
在国产GPU生态问题上,戴伟民介绍了开放标准行业组织科纳斯工业协会(Khronos Group)。2000年成立的Khronos Group是为多媒体处理制定开放标准的行业组织,该协会自成立20多年来,推出过Open GL(跨平台计算机图形API)、Open CL(跨平台通用计算API)、OpenXR(开放虚拟与增强现实标准)以及Vulkan(低开销、跨平台图像处理API)等被业界广泛接受的技术标准库。该组织的董事会成员有两家中国厂商,一家是芯原,另一家是华为。
“介绍Khronos的目的是要告诉大家,除了CUDA以外,还有其他生态可以选择。”戴伟民说到,“但是做GPU要有策略性,选择更好的生态圈实现起来才更容易。”就目前来说,CUDA还是最好的GPU生态;Vulkan光线追踪是业界第一个开放、跨厂商、跨平台的光线追踪加速标准,属于轻量级API,可大幅减少驱动程序,并为程序员提供更多灵活性;OpenCL则是跨供应商的标准API,是第一个面向异构系统通用目的并行编程的开放式、免费标准,也是一个统一的编程环境,支持多核心CPU、GPU、NPU、DSP以及其他并行处理器;OpenXR允许开发人员使用通用的高性能API,可以与任何3D API一起使用;OpenVX是一种开放的,免版税的标准,用于跨平台加速计算机视觉应用程序,可实现性能和功耗优化的计算机视觉处理,这在嵌入式和实时使用情况下尤其重要;SYCL是一种免版税,跨平台的抽象层,它允许使用标准ISO C ++编写异构处理器的代码,并在同一源文件中包含应用程序的主机代码和内核代码。
国产GPU的优势和市场策略
具体到GPU产品,涉及到硬件性能和软件生态,沐曦的优势在于创始团队是一支平均拥有15年以上从高性能GPU设计到量产交付全流程经验的全建制团队。
所以王磊认为,“在产品性能方面,沐曦团队还是比较自信的。”沐曦曾表示其GPU将采用5nm工艺技术,全兼容主流GPU生态,采用原创专利保护的可重构GPU架构,突破传统GPU芯片能效瓶颈;采用数据压缩、数据广播以及共享硬件加速单元等先进技术,大幅度优化核心算力能耗比。
最后是找到能够契合公司产品定位的市场并攻下山头,“就像攻城,要先找一个城防上的小缺口,找到我们擅长的领域和市场,让市场接纳才有机会做进一步迭代。”王磊说到。
芯动科技的市场切入点主要有两个方面:
一是弯道超车,因为元宇宙这类新概念出现后,基于云端的渲染需求出现了爆发式增长,云端渲染是相对较新的赛道,也比较适合芯动科技的GPU架构。芯动瞄准了这条赛道里面更细分的赛道,例如Windows和安卓。虚拟化跟传统市场也存在竞争关系,云上应用越广越多意味着虚拟化越来越普及,这会蚕食GPU的现有应用市场。“如果大家都采用虚拟化,英伟达的显卡销量就会变少,对巨头没有好处的市场他们不会快速推进,所以在虚拟化上我们可以抓住架构上的优势,在生态以点进行突破。” 毛鸣明说到,“另外要把虚拟化做好做稳定难度相当大,要做好用户和用户之间的资源隔离而且在一个用户出故障的时候不能影响其他用户。这是芯动可以做差异化的发力点之一。”
二是在传统应用方面,芯动可以做国产化。当前芯片国产化的呼声很高,只要能够拿出相对有竞争力的产品,国货还是有优势的。毛鸣明列举了几个典型应用,包括桌面和笔记本的入门级显卡、终端上的CAD应用,“有一个立足点就可以迭代,芯动科技在迅速迭代方面比较擅长,只要给我们一个抓手,两到三年的时间就可以慢慢渗透乃至进入这个市场。”
责编:Luffy Liu