在今年的IC领袖峰会上,来自天津飞腾的郭御风博士受邀作了题为“算力数智世界,用芯携手未来”的演讲。笔者借此机会专门采访了郭御风博士,并就国产CPU研发现状、技术线路规划和生态建设进行了深入交流。

在今年的IC领袖峰会上,来自天津飞腾的郭御风博士受邀作了题为“算力数智世界,用芯携手未来”的演讲。笔者借此机会专门采访了郭御风博士,并就国产CPU研发现状、技术线路规划和生态建设进行了深入交流。

2020年度中国优秀IC设计团队

郭御风博士担任天津飞腾信息技术有限公司CTO,主持过多款飞腾CPU芯片研制。作为研究员,他长期从事自主微处理器芯片研发工作,曾获得国家科技进步特等奖1项、国家科技进步一等奖1项、省部级科技进步一等奖2项。他获得国家发明专利30余项,发表学术论文30余篇。

飞腾高性能CPU研发团队荣获由ASPENSORE评选的“年度中国优秀IC设计团队”奖项。飞腾团队先后成功研发出FT-1500A/16、FT-2000+/64和腾云S2500等高性能服务器CPU,其最新成果腾云S2500是新一代多路服务器CPU,在多路扩展能力方面取得了重大突破,可支持2/4/8路直连,兼具高可扩展、高性能、高安全、高可靠、高能效五大核心能力,将为广泛的新基建应用提供高算力、高密度、多配置及低成本的整体解决方案。

国产CPUIntel/AMD CPU技术差距

相对于国际主流的Intel/AMD x86 CPU,国产CPU的差距主要表现在处理器的单核性能上。郭御风博士列举了国产通用CPU与Intel/AMD CPU在主频和制造工艺上的差距,目前国产CPU主频一般在2-3GHz之间,而国际厂商的处理器主频大多是4GHz以上。从这一点来看,国内CPU的单核性能跟国际主流还有3-5年的差距。从晶圆制造工艺来看,Intel采用自家的10nm工艺,AMD采用TSMC的7nm工艺,甚至最新的5nm工艺,而目前国产CPU主要还在16nm工艺节点上。此外,即便采用同样的工艺,代工厂商针对不同客户也会有不同的定制设计和工艺参数优化,国产CPU厂商在规模上还无法跟国际大厂竞争,毕竟现阶段出货量还比较低,只能用代工厂商的“货架套餐”。

在多核处理器研发上,国产CPU跟国际主流CPU的差距就没那么大了。随着摩尔定律的放缓,CPU性能的提升和迭代不像过去那么快了,技术和工艺也渐趋成熟。国产CPU厂商采用多核设计(16/64甚至更多内核)来弥补单核性能的不足,使得CPU性能跟Intel/AMD差距越来越小,只有2-3年的差距,有望在不久将来在同一水平竞技。

ARMv8架构授权

由于历史原因,国产CPU出现了多种架构并存的局面,比如龙芯CPU架构源自MIPS;兆芯采用x86架构;申威处理器采用源自ALPHA的自研架构;海光则采用AMD Zen架构;飞腾和华为鲲鹏采用的是ARMv8架构授权。郭御风博士详细解释了ARM架构授权与ARM内核授权的区别。

手机应用处理器(AP)开发商和MCU厂商普遍采用ARM内核授权模式,比如很多主打高性能的AP都采用ARM A系列内核,而强调低功耗的MCU大都采用ARM M系列内核。采用这些公版的通用型内核可以让芯片厂商快速开发出针对特定应用的处理器产品,但同质化问题导致难以获取差异化竞争优势。

ARM架构授权的高昂费用和开发难度让众多芯片厂商望而却步,国内芯片厂商中华为海思和天津飞腾获得了ARM架构授权。借助ARM的生态,架构授权厂商可以自主开发内核,像飞腾的FTC8xx高性能系列处理器内核、FTC6xx高效能系列处理器内核,以及FTC3xx低功耗系列处理器内核。此外,虽然华为鲲鹏服务器CPU和飞腾CPU均采用ARM架构,但因为各自的技术规划和业务模式不同,开发出的内核和CPU也有很大差异。作为系统厂商,华为的鲲鹏CPU更多是为自己的服务器所用,采取的是从芯片到系统的一条龙模式。而飞腾则采取独立第三方CPU与合作伙伴共建生态的模式,自己不会研发整机系统与合作伙伴构成竞争,而是专注于底层CPU技术支持,让硬件和软件合作伙伴针对各自擅长的应用领域去开发整机系统和开拓市场,携手开创合作共赢的国产化计算产业。

飞腾CPU产品线规划

据郭御风介绍,飞腾在算力开发和CPU产品研制上始终坚持十六字方针:从端到云、按需定制、安全可信、开放合作。在涉及国计民生的安全计算领域,需要全栈算力产品支撑,国产CPU厂商要做到云、边、端产品全覆盖,即服务器计算、客户计算(桌面电脑和人机交互)、嵌入式计算。

首先,飞腾“从端到云”提供全场景的算力产品,包括面向服务器和云端计算的高性能腾云S系列、面向客户计算的高效能腾锐D系列,以及针对工业控制和嵌入式计算的低功耗腾龙E系列。

飞腾面向不同应用场景的三条产品线。(来源:飞腾)

其次,“按需定制”就是通过自主研发,瞄准特定应用领域和应用场景的实际需求,进行定制和优化,例如云服务增强、深度学习增强、服务器增强和安全加固等。飞腾采取1-2年一次迭代和小步快跑的研发策略和方法,按需求定制设计产品和快速推向市场。

安全架构标准PSPA

谈到安全可信, 郭御风认为有三个层面的考量。第一是可获取性,即供应链保证以免出现“断供”现象;第二是可持续发展,国内厂商必须掌握核心技术以确保关键应用领域的计算需求不断得到满足和提升;第三是信息安全,在CPU底层硬件设计上不能有安全漏洞或“后门”。现在,“安全可信”已经是一个强需求,成为一个关键的CPU设计指标。

飞腾安全架构标准PSPA 1.0保障多场景应用的安全可信落地。(来源:飞腾)

自主CPU并不等同于安全,飞腾致力于将安全机制融入CPU产品和整个安全框架之中,构建CPU内生安全机制,从核心层面保障信息安全。在2019年生态发展大会上,飞腾率先发布国内首个CPU 层面的安全架构标准—PSPA1.0,以支持国产计算机系统自底向上的本质安全。飞腾将在明年推出PSPA2.0,对处理器架构安全一体化、面向虚拟化场景的辅助安全技术等进行进一步增强,提升内生安全程度。

共建生态

在生态和行业赋能方面,飞腾已经联合国内1600多家软件和硬件厂商,已经适配和优化的软硬件产品超过2500款。统计数据显示,2020年飞腾芯片出货量突破100万颗,完成交付芯片150万颗。

飞腾正在走平台化的发展路线,提供给客户的不再是单颗CPU芯片,而是面向应用场景的整套解决方案。最新发布的洞庭平台就是一种桌面计算平台化解决方案,可提供四种能力:多样化异构算力涵盖CPU+GPU+AI的算力;一体化内生安全,飞腾套片X100融入了CPU的PSPA1.0架构;丰富I/O接口,完整支持客户计算场景需求;支持不同主板的软件二进制兼容。

目前飞腾与生态伙伴已经发布超过100个行业解决方案,涵盖从端到云、5G、AI、云计算、大数据、安全可信等方向,覆盖电信、金融、能源、交通、教育、医疗、数字城市等行业领域,未来还有更多联合解决方案将陆续发布。

国产CPU技术发展

展望未来CPU算力的技术发展趋势,郭御风博士认为DSA(Domain-Specific Architecture)是一个发展方向。然而,DSA作为一个长期目标,还需要切实可行的方法论来实现中期目标,这就需要采用“敏捷开发”来支持DSA需求,但敏捷开发还不适合复杂的处理器芯片开发。怎么解决现阶段高端芯片快速研发迭代的问题呢?飞腾提出了“敏捷设计”的方法。简单来说,这种方法基于现有主流商用EDA工具和设计方法学,通过提高设计效率和规范设计流程来满足高性能通用微处理器设计的PPAC要求,从而降低开发难度,加速产品上市。

他提出了5个具体的设计方法:芯片设计的模块IP化、软件定义硬件化、设计自动化、流程平台化、系统标准化。以外,飞腾正在研发新一代服务器CPU和嵌入式CPU,同时持续对通用微处理器设计进行深度优化。

责编:Amy Guan

本文为《电子工程专辑》2021年4月刊杂志文 章,版权所有,禁止转载。点击申请免费杂志订阅 

本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
9月10日,苹果发布了一系列新品,包括iPhone 16系列手机、Apple Watch Series 10智能手表和AirPods 4耳机。发布会后网上响起了一片吐嘈声,带着这些吐槽,我们来看看这次苹果到底有没有新玩意……
不管怎么样,英特尔仍在努力推进18A芯片工艺,以期未来在最先进的芯片工艺上能与台积电、三星有一定的领先优势,毕竟其已经率先拿到ASML两台最先进的High NA(高数值孔径)EUV光刻机。未来,英特尔没有选择,只有抓住任何的可能性,硬着头皮上。
一直听说x86指令集天生做不了低功耗,真的是这样吗?这篇文章着重谈谈酷睿Ultra二代是怎么考量低功耗的,有没有可能做到低功耗...
Xockets认为,英伟达凭借侵犯该企业专利的DPU产品垄断了AI GPU服务器市场,而微软则垄断了支持GPU的AI平台领域。此外,Xockets还称这两家科技公司就授权费建立了垄断同盟。
经营业绩下滑,以及在代工业务上的巨额亏损以及市场需求疲软,也或是英特尔出售Mobileye股份的重要原因之一。
英伟达的CUDA生态系统和高性能AI GPU仍将作为核心竞争力,但要支撑其像以往那样的飞速的发展态势,必然要面临更大的挑战,或者已到增长的天花板。
• 得益于西欧、关键亚洲市场和拉丁美洲市场的增长,以及中国品牌的持续领先,全球折叠屏手机出货量在2024年第二季度同比增长了48%。 • 荣耀凭借其在西欧特别强劲的表现,成为最大的贡献者,成为该地区排名第一的品牌。 • 摩托罗拉的Razr 40系列在北美和拉丁美洲表现良好,为其手机厂商的出货量贡献了三位数的同比增长。 • 我们预计,头部中国手机品牌厂商的不断增加将至少在短期内抑制三星Z6系列在第三季度的发布。
AI技术的发展极大地推动了对先进封装技术的需求,在高密度,高速度,高带宽这“三高”方面提出了严苛的要求。
奕斯伟计算2024首届开发者伙伴大会以“绿色、开放、融合”为主题,从技术创新、产品应用、生态建设等方面,向开发者、行业伙伴等相关方发出开放合作倡议,加速RISC-V在各行各业的深度融合和应用落地,共同推动RISC-V新一代数字基础设施生态创新和产业发展。
2024年 Canalys 中国云计算渠道领导力矩阵冠军厂商分别是:阿里云、华为云和亚马逊云科技(AWS)
在全球智能手机竞争日益激烈的情况下,谁能在高端市场站稳脚跟,谁就占据了主动权。一直以来全球智能手机市场格局都是,苹果专吃高端,其他各大厂商分食全球中低端市场。但现在市场正在其变化。根据Canalys最
文|沪上阿YI路特斯如今处在一个什么样的地位?吉利控股集团高级副总裁、路特斯集团首席执行官冯擎峰一直有着清晰的认知:“这个品牌的挑战依然非常大。首先,整个中国市场豪华汽车整体数据下滑了30%~40%,
‍‍近期,IC 设计大厂联发科宣布了2024年上半年度的员工分红计划,与8月份薪资一起发放。据外界估算,按照上半年税前盈余约648.66亿新台币(约 144.42 亿元人民币)进行估算,此次分红总额接
在当今人工智能飞速发展的时代,AI Agent正以其独特的方式重塑着企业的生产运营方式。澜码科技作为AI Agent领域的先行者,其创始人兼CEO周健先生分享了对大模型与AI Agent发展现状的深刻
会议预告向世界展示中国最具创新力、领导力和品牌化的产品与技术!9月27号,“第6届国际移动机器人集成应用大会暨复合机器人峰会”将在上海举行,敬请关注!逐个击破现有痛难点。文|新战略半导体行业高标准、灵
近日,又一国产SiC企业宣布实现了主驱突破,并将出口海外。据“行家说三代半”的追踪统计,自2022年起,国内主驱级SiC器件/模块开始在多款车型中得到应用,尤其是2024年,本土供应商的市场份额显著上
‍‍据龙芯中科介绍,近日,基于龙芯3A6000处理器的储迹NAS在南京师范大学附属小学丹凤街幼儿园、狮山路小学、南京大学附属中学等学校相继落地。储迹NAS是基于最新的龙芯CPU--3A6000,其代表
8月28-30日,PCIM Asia 2024展在深圳举行。“行家说”进行了为期2天的探馆,合计报道了200+碳化硅相关参展企业(.点这里.)。其中,“行家说”还重点采访了骄成超声等十余家企业,深入了
随着汽车智能化升级进入深水区,车载ECU(域)以及软件复杂度呈现指数级上升趋势。尤其是多域、跨域和未来的中央电子架构的普及,以及5G/V2X等车云通信的增强,如何保障整车的信息与网络安全,以及防范外部