1月15日,天数智芯宣布,其7纳米通用并行(GPGPU)云端计算芯片Big Island(简称BI)已于近日“点亮”。这是国内首款全自研、基于GPU架构下的7纳米工艺GPGPU训练芯片,量产后将应用于AI训练、高性能计算(HPC)等场景,服务于教育、互联网、金融、自动驾驶、医疗、安防等各相关行业。
“点亮”是指电流顺利通过芯片,意味着芯片可用,后续测试修正后即可量产,如果进展顺利,有望在2021年投入商用。
“BI于2020年5月流片、11月回片并于当年12月成功‘点亮’。在过去的一个多月中,我们技术团队进行了一系列硬件、软件等近百项指标的测试,验证BI的实际功能符合设计标准。”天数智芯联合创始人、首席科学家郑金山介绍。
公开资料显示,天数智芯是一家专注于GPGPU芯片高性能计算系统的硬科技企业,成立于2015年,总部位于上海张江浦东软件园。2018年公司开始启动GPGPU大芯片设计。此前《电子工程专辑》曾刊登郑金山的谈国产GPGPU市场的一篇文章《GPGPU国产替代:中国芯片产业的空白地带》,引起了不小的关注。
AI芯片的技术架构主要有FPGA、ASIC和GPGPU三种。
FPGA是可编程门阵列(Field Programmable Gate Array)的缩写,用户可以通过硬件描述语言自己定义芯片的功能和用途。FPGA芯片的主要优势在于进行原型开发,它在性能和功耗方面有显著的缺陷,大规模应用存在着天然的阻碍。
ASIC是专用集成电路(Application Specific Integrated Circuit)的缩写,针对特定应用需求设计专门的芯片。ASIC芯片的优势在于同样功耗下,通过针对性的设计,可以实现突出的算力和功耗表现。它的问题主要表现在灵活性方面有局限,对软件服务有高强度的需求,长期来看经济性较差。但是ASIC芯片的开发周期短,商用化的过程比较快,目前国内多数AI芯片团队都选择这条路线。
GPGPU是通用图形处理器(General-purpose computing on graphics processing units)的缩写,可以满足广泛的图形计算需求。GPU最初的用途是图形计算,但是后来人们发现其图形计算能力和特性,在AI训练、AI推理、高性能计算等方面都有着非常好的表现。而且在编程模型上,GPGPU对于用传统语言编写的、软件形式的计算有较好的支持,具有高度的灵活性。因此,GPGPU在近年兴起的AI浪潮中成为炙手可热的技术。跟ASIC芯片相比,GPGPU具有更广泛的适用性、兼容性、灵活性,对技术变化的包容和适应能力更为突出,产品的应用生命周期更长。同时,通过性能挖掘优化,达成性能、能耗和性价比的最优解,实现跟ASIC芯片相当的算力和能耗水平。当然,GPGPU对团队的技术能力要求比较ASIC芯片高,开发周期也更长。
郑金山拥有21年芯片设计工作经验,曾先后供职于Trident、XGI、ATI Technologies、AMD超微半导体上海有限公司和酷芯微电子(Artosyn),任高级经理、PMTS和架构师等职位。专注于GPU IP设计多年,对GPU架构与设计有深厚的造诣。他建立与带领上海芯片设计团队参与过多个显卡(从Radeon HD2000到R400)芯片的研发与产品化,在酷芯微电子参与了机器视觉芯片9201的研发并成功量产。
郑金山曾对媒体表示,他之所以加入天数智芯,吸引他的就是开发国内首款GPGPU大芯片。
据了解,GPGPU在芯片研发中是难度很大的,一颗芯片的研发投入在10亿元左右,这些原因使得国产芯片在这一领域始终没有突破,主要是英伟达、AMD、英特尔等海外几家大公司在做。一般人对GPGPU没有什么概念。某头部供应商的一块高端GPGPU板卡,其售价接近一辆普通轿车的价格。
在国产GPU领域,景嘉微是国产GPU市场的主要参与者,也是国内唯一自主研发GPU并用于商用的公司,不过公司的GPU主要用于军用领域以及民用信创市场,目前公司下一代JM9系列GPU研发已处于后端设计阶段,目标进入国内信创以及人工智能、云计算等中高端应用领域。
目前国内GPGPU训练芯片的市场规模在80-90亿元左右,GPGPU的推理芯片市场规模在400-500亿元。
“现在时机成熟了,有国家政策支持,符合条件的企业可以去科创板融资,加上我们有很好的技术团队,我们专注这一领域的研发,希望成为这一市场的有力竞争者。” 天数智芯董事长蔡全根在BI芯片发布会上表示,天数智芯的产品可以兼容市场上的主流产品。
据悉,本次发布的BI芯片使用7纳米工艺及2.5DCoWoS封装技术,容纳240亿晶体管,支持FP32, FP/BF16, INT32/16/8等多精度数据混合训练,支持高速片间互联,单芯每秒可进行147万亿次FP16计算(147TFLOPS@FP16),每秒可完成上百路摄像头视频通道的人工智能处理。
“此次成功点亮的BI云端训练芯片具备高性能、通用性、灵活性,能够为人工智能和相关垂直应用行业提供匹配行业高速发展的算力,并通过标准化的软硬件生态接口为应用行业解决产品使用难、开发平台迁移成本大等操作层面的实际痛点。”郑金山说。
值得关注的是,这款芯片提供更优于国外主流对标产品的尺寸、性能、功耗和价格,可广泛应用于人工智能训练和超级计算等场景。
据悉,天数智芯已经和新华三、浪潮等国产服务器企业进行合作,产品在安防、智能交通、教育等领域都有庞大需求。“我们是三角模式,我们和最终用户以及服务器厂商三方一起合作,可以根据客户需求来定制一些差异化的产品。”蔡全根还表示,天数智芯成立至今融资近20亿元,公司也有登陆科创板的计划,希望在2022年能够提交上市申请书。
责编:Luffy Liu
本文综合自天数智芯官网、科技日报、澎湃新闻报道