近日,在由易维讯主办的第九届年度中国电子ICT媒体论坛暨2021产业和技术展望研讨会上,安谋科技高级FAE经理邹伟为业界深度解读Arm历经十年打磨才新发布的针对不同层次算力需求、机器学习(ML)发展路径的全新一代Armv9架构,其不仅是Arm架构演进的又一个里程碑,也将成为Arm未来十年及更远时代推进行业创新的基础。

近日,在由易维讯主办的第九届年度中国电子ICT媒体论坛暨2021产业和技术展望研讨会上,安谋科技高级FAE经理邹伟为业界深度解读Arm历经十年打磨才新发布的针对不同层次算力需求、机器学习(ML)发展路径的全新一代Armv9架构,其不仅是Arm架构演进的又一个里程碑,也将成为Arm未来十年及更远时代推进行业创新的基础。

安谋科技高级FAE经理邹伟现场演讲

Armv9:凭何改变高性能计算方式

纵观半导体设计在过去十多年的发展,特别是在终端消费等领域,算力带来的生产力的提升,通过移动互联网把大量的计算力放到每一个消费者的手中。与此同时,传统依赖于人工采集和分析数据的过程在第五波计算浪潮中正演变成机器对机器之间的数据采集、存储、分析和服务。由此产生的海量数据需要在云端、边缘侧配置更为强大的算力,并通过数据中心对获得的数据进行分析、构建和决策。

Arm在成为移动浪潮主流架构之外,已进入到边缘端和云端等新场景,其独特的定位可为行业实现稳固的安全基础,同时确保开发者以最简便、快速的方式来使用Arm的安全技术。据邹伟介绍,截止至2020年底,基于Arm IP的芯片累计售出1800亿颗,涵盖在各行各业每一个角落,每一个地方。共享的数据一定会有一个或多个环节经过Arm处理器计算,无论是数据采集的IoT设备,还是日常使用的手机、智能电脑,甚至服务器、超级计算机等。

据Arm预测,未来十年合作伙伴基于Arm芯片的出货量将超过3000亿,100%的共享数据将在Arm芯片上进行处理,无论是在终端还是在云端。因此,亟需一款全新的处理器架构在未来十年内改变计算的方式,以提供更高的性能、改善安全功能并增强工作负载功能。

邹伟现场介绍全新Armv9架构特性

“为此,Arm正式推出了面向未来十年的新一代架构Armv9,是在目前已经广泛使用的Armv8的基础上,继续使用AArch64作为基准指令集,保持了向下兼容性,在此基础上分别在安全性、AI与ML以及可伸缩矢量扩展和DSP上做出改进,扩展了应用范围。”邹伟表示,“Armv9构架实现的处理器可用于移动计算、HPC高性能计算、汽车和AI等市场等,以满足全球对功能日益强大的安全、人工智能和专用处理的需求,这意味着基于 Arm 架构的计算技术也将在智能手机以外的市场上获得领导地位,借助移动生态系统带来的巨大规模优势,在笔记本电脑、台式机、云等应用领域打造领先的解决方案。”

Arm全面计算解决方案赋能终极数字体验

尽管近些年全球半导体产业风云变幻,但提供先进算力始终是产业发展的根本目标。从这个角度来看对芯片设计企业又将面临哪些挑战呢?邹伟分析道,首先是CPU的负载越来越复杂,多样化不同的场景中会需求不一样,每个环节面临的挑战都不一样;而摩尔定律虽然减缓,但市场对性能、功耗的追求依然没有停歇,这也是一大挑战;此外,高昂的掩膜价格以及生产周期变长,设计一款5纳米的芯片成本会非常高、生产周期又非常长。“我们希望芯片设计不仅覆盖当前的应用,也能覆盖以后的应用,以获得更长的生命周期,这要求我们通过架构、设计、IP来应对这些客户遇到的挑战。”他强调道。

如果赋能终极的数字体验是Arm构建未来计算愿景的驱动力,那Arm提出最新全面计算解决方案则是开启Armv9时代未来十年之旅的第一步。Arm全面计算解决方案采用系统范围的整体优化方法,横跨硬件IP、物理IP、软件、工具和标准,为Arm的合作伙伴提供更为广泛的选择,满足所有终端细分市场的应用场景和成本区间,让他们能够满怀信心地通过最新的技术,将高性能的产品快速推向市场。

作为Arm全面计算解决方案的基石,全新的Arm Cortex CPU包括Arm目前性能最强大的Arm Cortex-X2、首款基于Armv9架构的大核CPU Arm Cortex-A710以及Arm过去四年来推出的首款高效率小核Arm Cortex-A510和Armv9-A CPU 群集。为支持生态系统对于性能的需求,Arm的全球合作伙伴正在努力确保所有app都将在今年年底前支持64位。正如邹伟在演讲中所述,算力多样化时代,Arm认为CPU的算力水准依然非常重要,它搭建了数字未来的基础底座。

而在每代CPU性能动辄20-30%的大幅提升背后,是Arm对频率、带宽、时延、缓存、工艺水平等各项指标一点点提升的不懈追求,在计算基础架构的创新上一直牵引着行业的进展。因此除了提升CPU性能之外,Arm全面计算解决方案同样希望做系统级的提升,为客户带去更好的设计体验。

此外,视觉体验是消费者与设备交互、并享用设备的关键。据悉,最新的Arm的Mali系列GPU正搭配全面计算解决方案中的Armv9 CPU,可以提供卓越的用户体验。据邹伟透露,未来Mali系列GPU也将持续超越大家的期待,带来光线追踪技术、可变速率着色VSR技术以及其他高级渲染技术等。

Arm 的互连技术对于提高系统性能同样至关重要。最新的CoreLink CI-700一致性互连技术和CoreLink NI-700片上网络互连技术与Arm CPU、GPU和NPU IP无缝搭配,可跨SoC解决方案增强系统性能。CoreLink CI-700和CoreLink NI-700对新的Armv9-A功能提供硬件级支持,并支持更高的安全性、改进的带宽和延迟。

引入全新安全性功能,守护数据核心资产

随着全球联网设备激增,芯片的安全性日益重要。对安全性的根本需求是重新思考如何处理安全性,而Armv9架构则通过引入Arm机密计算体系结构(Confidential Compute Architecture, CCA)来重新设计安全应用程序的工作方式。机密计算通过打造基于硬件的安全运行环境来执行计算,保护部分代码和数据,免于被存取或修改,甚至不受特权软件的影响。    

邹伟进一步解释道,Arm CCA将引入动态创建机密领域(Realms)的概念,机密领域面向所有应用,运行在独立于安全或非安全环境之外的环境中,是存储数据和执行代码的动态安全区域,与操作系统或管理程序的特权模式分离,以实现保护数据安全的目的。例如,在商业应用中,机密领域可以保护系统中商用机密数据和代码,无论它们正被使用、闲置或正在传输中。Arm机密计算体系结构建立在Arm的TrustZone技术之上,是软件容器的硬件版本,允许应用程序轻松地在不同的系统上运行。例如在非安全区的运行的应用程序可以动态申请机密领域,以保护自己的算法或数据。

 

“Arm还与合作伙伴共同开发平台安全架构PSA,作为一套标准的威胁模型、措施及时间,提供给终端设计人员使用,它与分级认证相结合后可以让此设备的采购者对资产的安全性更放心。例如在国内我们便和中国信息通信研究院泰尔实验室等联合,以支持基于PSA框架的安全物联网解决方案大规模部署。” 邹伟补充道。

打造新计算时代的大计算平台

除了安全性之外,机器学习也被视为Armv9的重要组成部分,因为在未来几年中越来越多的机器学习工作负载将变得司空见惯,在机器学习方面Armv9架构支持BFloat16格式,从而更好地去支撑Int8计算和BFloat16 的机器学习;可伸缩矢量扩展2(SVE2)的引入,则能够更好地帮助开发者对高阶的应用场景进行开发,在处理 5G、虚拟现实和增强现实以及图像和语音识别等任务负载时具有很大增益。

放眼瞬息万变的数字世界,智能终端不仅需要具备灵活性强、功耗低的特点,同时还要满足AI/ML的工作负载需求,这些挑战正推动更安全和专用处理的发展,也是打开新市场、抓住新机遇的关键。Armv9架构的发布与全面计算解决方案以安全技术作为基础,将解锁整个生态系统的新体验,为未来十年构建可信的数字化服务。

邹伟总结到:“新一代Armv9架构将赋能开发者通过弥合软硬件之间的关键差距,构建和编程未来的可信计算平台,帮助我们的合作伙伴在更快的上市时间和成本控制之间取得平衡。安谋中国则致力于从技术到生态全面推动算力革命,并将在自研架构上加大投入,持续携手生态合作伙伴,依托领先的Arm全球生态深入做强本土研发,持续赋能本土产业创新的企业战略。” 

责编:Amy  Guan

阅读全文,请先
您可能感兴趣
即使在最佳设计中,噪声和干扰也会悄然降低信噪比、掩盖所需信号并影响测量精度和可重复性。示波器和数字化仪等数字化仪器集成了多种功能,用于表征、测量和减少噪声对测量的影响。
本文介绍了一些生成常见且有用的噪声类型的好方法,包括白色、粉色和褐色(可选)。核心组件是一个经过编程的MCU,用于生成原始白噪声,以及一个改进的滤波器,用于将白噪声转换为粉色噪声。
仿真程序有助于分析和设计电源转换器及其控制算法。
人类的发明,即工程系统,依赖于物理学和数学基本原理,如麦克斯韦方程、量子力学和信息论等,以实现特定目标。然而,随着工程系统复杂性和规模迅速增长,其子组件的功能可能呈现出非线性特性,这使得基于第一原理的设计方法受到限制。
过去几十年来,全球能源消耗稳步增长,预计还会进一步增长。
光电探测器的性能因材料不同、结构不同、制备工艺及应用场景的不同而存在较大的差异。性能指标之间往往存在制约,如暗电流与输出电流、灵敏度与响应度、可靠性与灵敏度等需要权衡。对于性能表征也是如此,例如高响应度与高精度电流表征无法同时进行。
全球人形机器人领域上市公司的百强名单将人形机器人产业链区分为大脑、身体以及集成三大核心环节,覆盖全球共计100家上市公司。中国共37家企业上榜(中国大陆32家,台湾5家),其中深圳7家,占中国大陆上榜企业近四分之一,包括比亚迪、腾讯、优必选、速腾聚创、雷赛智能、兆威机电、汇川技术等......
DeepSeek模型虽降低AI训练成本,但AI模型的低成本化可望扩大应用场景,进而增加全球数据中心建置量。光收发模块作为数据中心互连的关键组件,将受惠于高速数据传输的需求。未来AI服务器之间的数据传输,都需要大量的高速光收发模块......
凭借新一代3nm制程工艺与全新架构,骁龙® 8至尊版的单核和GPU 性能提升均超过 40%,使得Find N5在性能上实现质的飞跃……
简化物联网连接:应用就绪型软件构建模块
据业内人士2月11日透露,三星显示器近期限时推出名为“平衡假期”的特别假期。具体内容是,每周平均工作超过52小时的员工可获得三天带薪休假,每周工作超过60小时的员工可获得六天带薪休假。上个月,三星显示
2月10日消息,天眼查App显示,近日,杉杉控股有限公司发生工商变更,周婷卸任法定代表人,并由董事长变更为董事;周顺和接任法定代表人并担任董事长;孙伟卸任董事职务。 2月7日,杉杉集团在宁波市鄞州区人
当地时间2025年2月10日,恩智浦半导体公司 (NXP) 宣布,已与高性能、节能和可编程离散神经处理单元 (NPU) 领域的行业领导者 Kinara 达成最终收购协议。此次收购将以全现金方式进行,
近日,中国证监会官网显示,格兰菲智能科技股份有限公司(简称“格兰菲”)已在上海证监局办理辅导备案登记,正式启动A股上市进程,辅导机构为海通证券。据披露,格兰菲成立于2020年12月,注册资本为1.28
2022年下半年以来,需求下降,芯片价格跳水,芯片行情趋向寒冷,拼价格、拼服务、拼账期成为常态,持续的低迷之下,芯片人都开始靠省钱过日子。同时,我们发现,行情冷淡的时候,订货、配单、PPV(Purch
2月11日,特斯拉上海储能超级工厂投产仪式今日在上海临港举行,这一重要项目的投产标志着特斯拉在华业务的进一步拓展。特斯拉上海储能超级工厂于 2024 年 5 月正式在上海临港新片区开工建设。从开工到产
周一,埃隆·马斯克与一群投资者提出以974亿美元收购ChatGPT开发商OpenAI,这一金额远低于这家人工智能公司最近1570亿美元的估值。OpenAI首席执行官萨姆·奥特曼在X平台上发文,立即拒绝
一年一度的新能源汽车“掀桌子”活动又开始了,前两年新能源汽车“价格战”的阴影还没有消散,今年关于智能驾驶只怕又要卷生卷死了。搅动风云的,依旧是那个男人,依旧是那个品牌——比亚迪,又来掀桌子了。昨晚,比
点击蓝字 关注我们SUBSCRIBE to US想象一下,有一种人工智能(AI)不仅仅遵循你的指令,还能自行决定如何实现你的目标。代理型人工智能(Agentic AI)正是如此:这是人工智能的一个新前
我是芯片超人花姐,入行20年,有40W+芯片行业粉丝。有很多不方便公开发公众号的,关于芯片买卖、关于资源链接等,我会分享在朋友圈。扫码加我本人微信👇2月15日,芯片超人开年首场芯片大会,2025年AI