作为一家专注于人工智能领域云端算力的高科技公司,燧原科技自2018年成立以来,已累计获得32亿人民币投资。经过几年的发展,目前,燧原科技员工人数超过五百人,研发人员接近90%,拥有52项专利(包括45项发明专利),还有近30项专利正在申请。
在公司成立18个月后,燧原科技成功推出第一代训练芯片“邃思1.0”和“云燧T10/T11”人工智能训练加速卡。两年后,2021年7月,全新一代“邃思2.0”和“云燧T20/T21”芯片面世,多项性能指标刷新了中国芯片的记录,也让燧原科技成为了国内首家发布第二代人工智能训练产品组合的公司。
中国计算芯片的多项纪录被刷新
新发布的邃思2.0芯片采用2.5D封装,整合了9颗芯片,整体封装尺寸达到了惊人的57.6mm×57.6mm。燧原科技创始人兼COO张亚林在发布会上强调称,这是目前中国最大的计算芯片,即便与竞争对手的旗舰产品相比也毫不逊色。
邃思2.0进行了大规模的架构升级,采用了新一代全自研的GCU-CARA全域计算架构,针对人工智能计算的特性进行深度优化,夯实了支持通用异构计算的基础;支持全面的计算精度,涵盖从FP32、TF32、FP16、BF16到INT8,并成为中国首款支持单精度张量TF32数据精度的人工智能芯片。单精度FP32峰值算力达到40 TFLOPS,单精度张量TF32峰值算力达到160 TFLOPS,以上数据均为国内第一。
张亚林指出,TF32几乎可以应用在大部分AI场景中,包括机器视觉、语音、自然元翻译、强化学习等,都具有应用TF32的潜力。从行业趋势来看,TF32很可能会成为用于训练业务的最重要的数据精度类型之一。
值得关注的是,邃思2.0芯片上共搭载了4颗HBM2E片上存储芯片,高配支持64 GB内存,带宽达1.8 TB/s,这也是中国第一颗支持HBM2E和单芯片64 GB内存的产品。
“燧原的每一代产品必须比前一代在‘平均业务’中将每瓦性能提升三倍以上。“这是张亚林代表燧原科技公布的“燧原产品定理”,基于上述思路,燧原还同时发布了公司训练计算产品和推理计算产品路线图。根据规划,下一代训练芯片将于2023年面世,每瓦性能会比邃思2.0提升两倍。届时还会有推理芯片同步亮相,其性能也将获得大幅提升。
燧原科技第二代通用人工智能训练加速卡“云燧T20”是一个全高全长的PCIE板卡,在FP 32/TF 32下的峰值算力可以达到134.4T(单精度张量)和33.6T(单精度)。在BF16/FP16下的峰值算力则能做到134.4T,INT8的峰值算力更是达到了268.8T,可以与友商旗舰一较高下。云燧T21采用OAM模组模式设计,在多个模式下拥有杰出的表现。
除了硬件性能的提升,为了降低开发门槛,燧原科技还在互联与软件上加大了投入。
GCU-LARE全域互联技术即为代表之一,作为一项专为人工智能训练集群研发的互联技术,GCU-LARE能提供双向300GB/s互联带宽,支持数千张云燧CloudBlazer加速卡互联,实现优异的线性加速比。
与此同时,燧原自主知识产权的计算及编程平台驭算TopsRider也获得了升级。通过软硬件协同架构设计,全新的驭算TopsRider能够充分发挥邃思2.0的性能;基于算子泛化技术及图优化策略,能支持主流深度学习框架下的各类模型训练;再通过利用Horovod分布式训练框架与GCU-LARE互联技术相互配合,为超大规模集群的高效运行提供解决方案。开放升级的编程模型和可扩展的算子接口,为客户模型的优化提供了自定义的开发能力。
基于训练加速卡,燧原还推出了超大规模智算集群,被命名为“云燧智算集群(CloudBlazer Matrix 2.0)”。该智算集群包含了8192张云燧训练卡,可实现最高1.3E的算力,代表着燧原“正使用集群化产品登上中国智能计算和新基建算力舞台”,张亚林说。
星星之火,可以燎原
在工业4.0“智造”时代,人工智能是关键动力。但因为摩尔定律放缓,产业必须加快在异构计算领域的投入,这就意味着以芯片为核心的算力将成为工业4.0兵家必争之地。基于上述考虑,燧原科技推出了异构计算生态——“燎原”计划。
燧原科技CEO赵立东表示,“燎原”计划有三大特征和目标,第一,一定要原始创新,自己从头打造基础;第二,一定要建立标准化生态,第三,以开放的姿态共建生态。三个目标则分别是以人工智能为起点,构建通用异构计算生态,构建标准化的技术体系,以及共建完整生态服务数字中国。而“燎原”计划的内涵也包括繁荣开放的开发者生态、健康互利的产业生态和持续创新的教科研生态。
不仅如此,燧原科技正在与杭州之江实验室、上海交通大学、西安交通大学等一系列产学研伙伴合作,这些合作都依附于燧原科技已有产品进行合作,通过现有的产品不断去打磨生态。
张亚林指出,2020年燧原科技公布第一个客户落地开始,就一直在坚持三条业务线:泛互联网、传统行业和新基建,在这三个业务线上不断发力,构筑整个业务群,同时也得到了非常多的客户反馈,这在反馈侧面印证了客户对燧原科技的重视度,也助力催生了第二代产品。所以,第二代产品是在看到一些客户的需求后推出的。燧原整个公司推出的产品与节奏,第一代和第二代间距是一年半,快于行业内的标杆速度。