2022年8月17日,在由AspenCore主办的“2022中国IC领袖峰会”上,亚马逊云科技大中华区行业业务拓展总监叶明,介绍了亚马逊云科技的云端EDA设计方案如何为芯片设计公司减少风险、加快流片速度、提高设计效率。
亚马逊的实践:芯片设计可在云端完成
亚马逊不仅是全球最大的电商平台,也是半导体产业链的重要一员。近年来,亚马逊旗下云计算服务平台——亚马逊云科技凭借在云计算领域的优势,建立起全球最大规模的云基础设施。
叶明介绍说:“为了给客户提供更直接的价值,我们也为自己的云中心服务设计、开发了很多芯片,其中所涉及到的系统包括——用于基础架构和虚拟化提高的系统、服务器芯片训练系统、机器学习和推理系统等。”
亚马逊现在的芯片设计团队,由该公司原本的芯片设计团队与Annapurna Labs团队融合而成。前者与2015年并购了后者,在许多业内人士眼中,这起交易是亚马逊最成功的交易之一。通过回顾亚马逊芯片设计团队的发展史,我们也看到了芯片设计从本地迁移到云端的全过程。
- 2011年,Annapurna Labs成立,该公司基于以色列的本地数据中心创建,是一家为超大规模数据中心和边缘计算设计基于Arm架构芯片的厂商;
- 2014年,亚马逊芯片研发部门成立;
- 2015年,亚马逊以3.5亿美元收购以色列芯片公司Annapurna Labs。
- 2016年,亚马逊的芯片设计流程逐渐从混合架构迁移到全云端设计;
- 2017年,亚马逊云科技正式推出Nitro,将网络、存储和安全任务卸载到基于Arm架构的专用设备上,此时亚马逊逐步减少本地数据中心。
- 2019年底,亚马逊云端实现完整的SoC开发,并推出了7nm工艺的CPU芯片(Graviton2),至此亚马逊的本地数据中心仅用于模拟器。
据叶明的介绍,从2016年开始把亚马逊的芯片设计流程,从混合架构迁移到全云端设计,到2019年底推出7nm CPU(Graviton2)。亚马逊凭借自己在芯片设计行业积累的经验和实践,帮助芯片设计企业把芯片设计迁移到云端。
支持跨区域团队设计协同
2021年12月,亚马逊在Graviton2的基础上推出了Graviton3,这是基于Arm架构的第三代Graviton处理器。Graviton3采用了5nm制程,Chiplet小晶粒设计(7颗晶粒),内部包含550亿个晶体管,单核性能比Graviton2提升了25%以上。另外,Graviton3也是首个支持DDR5系统的芯片,其内存带宽比Graviton2增加了50%。
除了优秀的处理器芯片之外,亚马逊云科技分布在全球各地的基础设施,能支持跨区域团队设计协同。凭借全球基础设施的部署,芯片设计公司可链接亚马逊云科技分布在全球的设计团队。
据了解,亚马逊云科技在全球26个独立区域均有基础设施,每个独立区域还包含了多个可用区,这些可用区在物理上相互隔离,即使某个可用区出现了无法服务的情况,也不会影响其他可用区的正常运营。同时,通过覆盖全球的高冗余100Gbps网络,亚马逊云科技也能全球客户提供高可靠、低延时、高吞吐量的网络连接。
“我们能保证各设计团队之间,不会因算力瓶颈而出现任务排队的情况。在云端几乎无限算力的支持下,助力芯片设计企业缩短验证和流片的周期。”叶明表示。
灵活的云端EDA设计方案
为了应对芯片设计公司多样化的需求,亚马逊云科技联合半导体产业合作伙伴,共同打造了多种灵活云端EDA设计方案,包括全云设计环境、混合模式设计环境、SaaS模式设计环境。
全云设计方案适用于项目流片周期很紧,又缺乏本地机房的芯片设计企业。全云能实现高效全流程设计和验证,提供从RTL到GDSII的全流程设计和验证。
混合模式设计方案适用于正在设计数字化SoC芯片的企业。物理验证阶段后期需要大量算力,本地数据中心资源可能会成为瓶颈,混合式架构能充分借鉴云上算力和本地资源,来满足对峰值算力的要求,并加速芯片Sign off(签核)周期。
SaaS模式设计方案适用于缺乏IT资源运维高性能计算或设计的初创公司。通过一站式EDA设计服务,帮助初创公司把资源和精力集中在创新上,而非维持大IT团队运维复杂系统上。
灵活计价模式带来最优成本
在云端EDA设计方案计价方面,亚马逊云科技还能提供灵活的计价模式。芯片设计公司可根据自身项目周期及IT资源需求规划,来优化组合以实现成本的最小化。
其中,按需计算实例按秒支付计算资源费用,无需长期承诺,对于常规性、计划性的算力需求,可采用这种模式;在设计后段物理验证阶段,需要峰值计算时可采用预留计算模式,这个模式在计算资源价格上有显著优势;竞价闲置EC2(弹性计算云)计算实例,可以获得相对按需资源最高达90%的折扣。
叶明还分析了亚马逊云科技为一家企业做的本地与混合架构三年TCO(总拥有成本),直观地展现了灵活计价模式可以带来的总成本优化。云上混合设计模式能降低42%的总拥有成本,帮助该企业经营从Capex(资本性支出,一般指资金或固定资产、无形资产、递延资产等资产的投入)走向Opex(运营支出,指企业的管理支出、办公室支出、员工工资支出和广告支出等日常开支)。值得注意的是,采用灵活的优化配置,还能在原本已降低42%的基础上,进一步降低总拥有成本。
如今,亚马逊云科技正联合上下游生态合作伙伴建立产业链互信协同。产业互信协同安全平台致力于为芯片设计厂商提供集设计、验证、流片和计算资源为一体的服务,帮助芯片设计企业减少风险、加快流片速度、提高设计效率。叶朋透露说:“我们已经与全球主要的EDA厂家建立起密切的合作,我们的方案也得到了晶圆制造厂的安全认证,同时我们还与合作伙伴在中国打造了EDA设计方案和良率分析方案。”
EDA“上云”应用案例介绍
云端EDA设计方案在应用方面已经有了一些代表性案例,叶朋介绍了Arm和NXP(恩智浦)两家公司的使用情况。
Arm在亚马逊云端应用基于Arm内核的服务器,大幅缩短了K库运行周期,助力提升设计效率且改善能成本。Arm还能从云上获得以下收益:按需快速扩展EDA运行集群所需要的服务器核数,能从5000核拓展快速扩展到30000核;可有效避免资源需求预测不精准造成的资源浪费;灵活支持创新和实验类项目;在运行基于Arm为内核的Graviton2时可降低30%的成本。
亚马逊云科技与NXP(恩智浦)的合作始于2017年,借助亚马逊云科技高弹性算力,恩智浦获得了按需同时推进多个项目的规模算力和敏捷性,无需考虑项目的复杂性,而且能够并发运行数十个性能模拟,从而缩短获得结果的时间。到2021年10月,恩智浦选择亚马逊云科技为首先云服务提供商,将绝大部分EDA工作负载从本地数据中心迁移到亚马逊云平台。
小结:亚马逊云科技可赋能芯片企业哪些价值?
最后,叶朋总结了半导体企业能在亚马逊云科技上获得的四大价值:
支持更快的创新。具有高弹性、高性能及高安全性的云端EDA基础框架,支持快速设计和验证;
通过安全的访问连接全球各区域设计团队,从而提升设计协同;
提供安全互信上下游协同设计平台,提升流片成功率;
灵活丰富的配置选项,快速适配最佳资源,确保成本最优。
- 不要在这里鼓吹EDA上云了,EDA上云根本不靠谱,特别是国外的云,一是信息安全,二是说不让你用就不让你用