在今年的IC领袖峰会上,来自天津飞腾的郭御风博士受邀作了题为“算力数智世界,用芯携手未来”的演讲。笔者借此机会专门采访了郭御风博士,并就国产CPU研发现状、技术线路规划和生态建设进行了深入交流。
2020年度中国优秀IC设计团队
郭御风博士担任天津飞腾信息技术有限公司CTO,主持过多款飞腾CPU芯片研制。作为研究员,他长期从事自主微处理器芯片研发工作,曾获得国家科技进步特等奖1项、国家科技进步一等奖1项、省部级科技进步一等奖2项。他获得国家发明专利30余项,发表学术论文30余篇。
飞腾高性能CPU研发团队荣获由ASPENSORE评选的“年度中国优秀IC设计团队”奖项。飞腾团队先后成功研发出FT-1500A/16、FT-2000+/64和腾云S2500等高性能服务器CPU,其最新成果腾云S2500是新一代多路服务器CPU,在多路扩展能力方面取得了重大突破,可支持2/4/8路直连,兼具高可扩展、高性能、高安全、高可靠、高能效五大核心能力,将为广泛的新基建应用提供高算力、高密度、多配置及低成本的整体解决方案。
国产CPU与Intel/AMD CPU技术差距
相对于国际主流的Intel/AMD x86 CPU,国产CPU的差距主要表现在处理器的单核性能上。郭御风博士列举了国产通用CPU与Intel/AMD CPU在主频和制造工艺上的差距,目前国产CPU主频一般在2-3GHz之间,而国际厂商的处理器主频大多是4GHz以上。从这一点来看,国内CPU的单核性能跟国际主流还有3-5年的差距。从晶圆制造工艺来看,Intel采用自家的10nm工艺,AMD采用TSMC的7nm工艺,甚至最新的5nm工艺,而目前国产CPU主要还在16nm工艺节点上。此外,即便采用同样的工艺,代工厂商针对不同客户也会有不同的定制设计和工艺参数优化,国产CPU厂商在规模上还无法跟国际大厂竞争,毕竟现阶段出货量还比较低,只能用代工厂商的“货架套餐”。
在多核处理器研发上,国产CPU跟国际主流CPU的差距就没那么大了。随着摩尔定律的放缓,CPU性能的提升和迭代不像过去那么快了,技术和工艺也渐趋成熟。国产CPU厂商采用多核设计(16/64甚至更多内核)来弥补单核性能的不足,使得CPU性能跟Intel/AMD差距越来越小,只有2-3年的差距,有望在不久将来在同一水平竞技。
ARMv8架构授权
由于历史原因,国产CPU出现了多种架构并存的局面,比如龙芯CPU架构源自MIPS;兆芯采用x86架构;申威处理器采用源自ALPHA的自研架构;海光则采用AMD Zen架构;飞腾和华为鲲鹏采用的是ARMv8架构授权。郭御风博士详细解释了ARM架构授权与ARM内核授权的区别。
手机应用处理器(AP)开发商和MCU厂商普遍采用ARM内核授权模式,比如很多主打高性能的AP都采用ARM A系列内核,而强调低功耗的MCU大都采用ARM M系列内核。采用这些公版的通用型内核可以让芯片厂商快速开发出针对特定应用的处理器产品,但同质化问题导致难以获取差异化竞争优势。
ARM架构授权的高昂费用和开发难度让众多芯片厂商望而却步,国内芯片厂商中华为海思和天津飞腾获得了ARM架构授权。借助ARM的生态,架构授权厂商可以自主开发内核,像飞腾的FTC8xx高性能系列处理器内核、FTC6xx高效能系列处理器内核,以及FTC3xx低功耗系列处理器内核。此外,虽然华为鲲鹏服务器CPU和飞腾CPU均采用ARM架构,但因为各自的技术规划和业务模式不同,开发出的内核和CPU也有很大差异。作为系统厂商,华为的鲲鹏CPU更多是为自己的服务器所用,采取的是从芯片到系统的一条龙模式。而飞腾则采取独立第三方CPU与合作伙伴共建生态的模式,自己不会研发整机系统与合作伙伴构成竞争,而是专注于底层CPU技术支持,让硬件和软件合作伙伴针对各自擅长的应用领域去开发整机系统和开拓市场,携手开创合作共赢的国产化计算产业。
飞腾CPU产品线规划
据郭御风介绍,飞腾在算力开发和CPU产品研制上始终坚持十六字方针:从端到云、按需定制、安全可信、开放合作。在涉及国计民生的安全计算领域,需要全栈算力产品支撑,国产CPU厂商要做到云、边、端产品全覆盖,即服务器计算、客户计算(桌面电脑和人机交互)、嵌入式计算。
首先,飞腾“从端到云”提供全场景的算力产品,包括面向服务器和云端计算的高性能腾云S系列、面向客户计算的高效能腾锐D系列,以及针对工业控制和嵌入式计算的低功耗腾龙E系列。
飞腾面向不同应用场景的三条产品线。(来源:飞腾)
其次,“按需定制”就是通过自主研发,瞄准特定应用领域和应用场景的实际需求,进行定制和优化,例如云服务增强、深度学习增强、服务器增强和安全加固等。飞腾采取1-2年一次迭代和小步快跑的研发策略和方法,按需求定制设计产品和快速推向市场。
安全架构标准PSPA
谈到安全可信, 郭御风认为有三个层面的考量。第一是可获取性,即供应链保证以免出现“断供”现象;第二是可持续发展,国内厂商必须掌握核心技术以确保关键应用领域的计算需求不断得到满足和提升;第三是信息安全,在CPU底层硬件设计上不能有安全漏洞或“后门”。现在,“安全可信”已经是一个强需求,成为一个关键的CPU设计指标。
飞腾安全架构标准PSPA 1.0保障多场景应用的安全可信落地。(来源:飞腾)
自主CPU并不等同于安全,飞腾致力于将安全机制融入CPU产品和整个安全框架之中,构建CPU内生安全机制,从核心层面保障信息安全。在2019年生态发展大会上,飞腾率先发布国内首个CPU 层面的安全架构标准—PSPA1.0,以支持国产计算机系统自底向上的本质安全。飞腾将在明年推出PSPA2.0,对处理器架构安全一体化、面向虚拟化场景的辅助安全技术等进行进一步增强,提升内生安全程度。
共建生态
在生态和行业赋能方面,飞腾已经联合国内1600多家软件和硬件厂商,已经适配和优化的软硬件产品超过2500款。统计数据显示,2020年飞腾芯片出货量突破100万颗,完成交付芯片150万颗。
飞腾正在走平台化的发展路线,提供给客户的不再是单颗CPU芯片,而是面向应用场景的整套解决方案。最新发布的洞庭平台就是一种桌面计算平台化解决方案,可提供四种能力:多样化异构算力涵盖CPU+GPU+AI的算力;一体化内生安全,飞腾套片X100融入了CPU的PSPA1.0架构;丰富I/O接口,完整支持客户计算场景需求;支持不同主板的软件二进制兼容。
目前飞腾与生态伙伴已经发布超过100个行业解决方案,涵盖从端到云、5G、AI、云计算、大数据、安全可信等方向,覆盖电信、金融、能源、交通、教育、医疗、数字城市等行业领域,未来还有更多联合解决方案将陆续发布。
国产CPU技术发展
展望未来CPU算力的技术发展趋势,郭御风博士认为DSA(Domain-Specific Architecture)是一个发展方向。然而,DSA作为一个长期目标,还需要切实可行的方法论来实现中期目标,这就需要采用“敏捷开发”来支持DSA需求,但敏捷开发还不适合复杂的处理器芯片开发。怎么解决现阶段高端芯片快速研发迭代的问题呢?飞腾提出了“敏捷设计”的方法。简单来说,这种方法基于现有主流商用EDA工具和设计方法学,通过提高设计效率和规范设计流程来满足高性能通用微处理器设计的PPAC要求,从而降低开发难度,加速产品上市。
他提出了5个具体的设计方法:芯片设计的模块IP化、软件定义硬件化、设计自动化、流程平台化、系统标准化。以外,飞腾正在研发新一代服务器CPU和嵌入式CPU,同时持续对通用微处理器设计进行深度优化。
责编:Amy Guan
本文为《电子工程专辑》2021年4月刊杂志文 章,版权所有,禁止转载。点击申请免费杂志订阅