9月15日,“万物智能——百度世界2020”大会召开。在当天下午的百度大脑分论坛上,百度智能芯片总经理欧阳剑透露了百度昆仑芯片的进展。
百度智能芯片总经理欧阳剑
据透露,百度昆仑1已量产,采用三星14nm工艺,已在百度搜索引擎及云计算用户部署2万片,相比T4 GPU 性能在不同模型下提升1.5-3倍。
在本次会议上,同时预发布了采用7nm 先进工艺的百度昆仑2,性能比百度昆仑1 提升3倍,还带有高速片间互联,多款细分型号,覆盖云训练、云推理以及边缘计算等优势。预计2021年上半年量产。
欧阳剑介绍了AI芯片的发展背景。他讲到,每个IT发展的阶段都有非常独特的芯片处理器架构:大型机、小型机的时代,芯片的架构是定制的处理器;PC+互联网时代,X86 CPU处理器为占据主场;移动+云的时代,处理器的架构变成Arm CPU与X86 CPU共存,其中Arm CPU占领移动端,X86 CPU占领了服务器端;AI+智能云时代,出现了全新的芯片架构——AI芯片。
百度研发AI芯片的积累得益于其用FPGA做AI加速的积累,也得益于其在软件定义加速器和XPU架构的多年积累。
据悉,百度最早在2010年开始用FPGA做AI架构的研发,2011年开展小规模部署上线,2017年部署超过了1万片FPGA,2018年发布自主研发AI芯片,2019年下半年流片成功,2020年开始量产,以及预计2021年第二代百度昆仑量产。
同时,百度昆仑团队还在业界最顶级的芯片会议Hotchips上发表了4篇论文,是目前国内发表最多的。
根据欧阳剑给出的数据,百度昆仑芯片可以实测到200多TOPS的实际的性能,对比业界最先进的T4的GPU 可实测到70左右的TOPS,百度昆仑相比T4有3倍的性能提升;而在图像分割YOLOV3算法中,百度昆仑性能大概是T4的2倍。
截止目前,百度昆仑芯片全面支持语音、图像、NLP模型,灵活支持用户自定义模型,支持传统机器学习模型;100%自主芯片的设计,可以实现和国产处理器,国产OS,国产框架的完成适配;同时其也是国内业界最大部署规模,并有超过10+个外部客户。
责编:Luffy Liu