亚马逊云科技re:Invent现场访谈:定制芯片将是大势所趋

原创 趣味科技v 2022-12-12 13:56

关注云服务市场的读者朋友想必都知道,虽然芯片市场早已有着英特尔、AMD、英伟达、高通、联发科技等诸多强有力的厂商,但是近年来针对某些应用,越来越多的云服务商开始推出自研芯片。

那么问题就来了:究竟是什么样的原因,让这些云服务商走上了定制芯片的道路?与大家熟知的传统芯片相比,这些定制芯片究竟拥有哪些优势?对于芯片市场而言,这种变化又预示着怎样的未来?

作为亚马逊云科技EC2产品管理总监,Chetan Kapoor主要负责人工智能、机器学习、高性能计算、图像处理、游戏开发等业务。在2022亚马逊云科技re:Invent全球大会现场,趣味科技通过对Chetan Kapoor的采访,逐一揭晓了以上问题的答案。

亚马逊云科技的三类计算服务

在计算领域,亚马逊云科技的产品与服务主要有三个大的分类。

1、按需索取:以Amazon EC2为代表。Amazon EC2的核心能力,就是将重要资源分离开来并按需交给客户。客户无需在本地进行硬件堆砌,只需使用一个API或者在亚马逊云科技的控制台发出计算资源请求后,即可向客户提供所需的服务。

2、无服务器:以Amazon Lambda系列为代表。该系列产品是一种无服务器计算组件,客户无需管理计算资源,只需提供相关代码并允许亚马逊云科技执行代码,亚马逊云科技就会围绕该代码提供一系列的相关应用,客户只需做好应用即可。

3、容器计算:容器化计算的所有应用都是基于容器,亚马逊云科技提供了一系列可以帮助客户开发容器化应用的服务;Amazon Fargate则让客户只需要创建容器,给出指令“这是我的容器,运行它”即可。

亚马逊云科技的自研芯片之旅

Chetan Kapoor透露,之前亚马逊云科技在很长时间里都是用英特尔、英伟达、AMD等合作伙伴的芯片,譬如Amazon EC2就是基于英特尔提供的芯片开发的,在机器学习领域采用了英伟达的GPU效果也非常不错。然而后续亚马逊云科技也不断收到客户的积极反馈,希望能够有更加细化的产品服务可供选择,帮助客户围绕某些应用降本增效,提升性能,以及更好地匹配应用需求。

“十年前亚马逊云科技开始做自研芯片,刚开始是Amazon Nitro虚拟化芯片,后面又开始打造Amazon Graviton CPU芯片。过去的四到五年里,我们的重点都是持续构建芯片来加速人工智能和机器学习应用的开发。”Chetan Kapoor介绍道,亚马逊云科技的自研芯片之旅是从开发Amazon Nitro芯片开始,它是帮助用户卸载虚拟化工作负载的专用芯片。通常硬件虚拟化的主要方式是让虚拟化软件在同一台服务器上运行,支持客户的工作负载。假设客户的服务器是48核心,那么大概需要预留10%-15%的算力来运行虚拟化软件。而Amazon Nitro是有自己独立CPU的芯片,具备单独完成虚拟化的能力,服务器就不需要承担虚拟化软件的资源开销,可以给客户交付更高性能的实例(云主机)。从此,亚马逊云科技就走上了定制芯片之路,也开始开发通用处理器,其中第一个版本就是4年前推出的Amazon Graviton。

除此之外,人工智能与机器学习也是客户向亚马逊云科技反馈较多的领域,尤其是当前深度学习模型的应用普及非常迅速,每年都会有十几倍的增长,训练这些深度学习模型需要消耗大量算力和成本,让许多企业不堪重负。为了帮助客户降低成本,亚马逊云科技开始进行自研深度学习推理芯片的开发,发布的第一款芯片就是2019年推出的Amazon Inferentia。随后亚马逊云科技又再接再厉推出了Amazon Trainium,主要针对机器学习训练工作负载。

在亚马逊云科技2022 re:Invent全球大会上,亚马逊云科技高级副总裁Peter DeSantis重磅发布了Nitro v5,其晶体管数量是前一代产品的2倍,提供了更多的计算性能,同时带来了50%的DRAM内存性能提升,2倍的PCle 带宽提升,每秒数据包速率(PPS) 提高60%,延迟改善30%,每瓦性能提高40%。亚马逊云科技CEO Adam Selipsky也在会上发布了下一代Amazon Inferentia2(简称Inf2),与Inf1实例相比可提供高3倍的计算性能、高4倍的吞吐量和低10倍的延迟。

定制芯片性能高成本低的奥秘

为什么与商用芯片相比,定制芯片既可以做到非常高的性能,又能够做到非常低的成本?

Chetan Kapoor揭晓了其中的奥秘:“因为专用芯片把运算能力都给到了客户,极大地提升了效率。以刚才介绍的Amazon Nitro为例,Nitro的特殊之处在于独立性,整个虚拟化是在独立的芯片和服务器运行,因此可以让客户得到服务器100%的算力资源,这也意味着客户得到的计算性能更高、成本更低。”

在Amazon Nitro芯片研发取得成功之后,亚马逊云科技就开始着手研发自己的处理器,希望能够帮助客户降低成本,提升效率。事实也证明,Amazon Graviton2的同规格实例性价比提升高达40%。而在人工智能与机器学习领域,亚马逊云科技也专门研发了针对机器学习推理的芯片,可以带来更好的性能、更低的成本以及更强的机器学习推理能力。与Amazon Graviton带来的收益类似,客户可以看到亚马逊云科技提供的机器学习芯片无论是用于模型训练还是日常生产,性价比都要比其他同类产品高出40%-50%。

在2022亚马逊云科技re:Invent全球大会上,亚马逊云科技高级副总裁Peter DeSantis还发布了Amazon Graviton3E 芯片以及高性能计算实例HPC7g、C7gn,与现有的Graviton系列产品相比,新的Amazon Graviton3E芯片无论是性能还是精度都有着更高的提升,其中对依赖矢量计算指令的工作负载其性能提高了35%。

定制芯片将会成为未来主流

从2006年3月14日亚马逊云科技发布第一个云存储服务Amazon Simple Storage Service(简称S3)至今,云计算已经走过了16年的发展历程。然而在Chetan Kapoor看来,其实一切还只是刚刚开始:“如今许多传统行业,包括金融和医疗等很多都还处于上云的初级阶段,很多企业还在用自建的数据中心,因此云计算在未来还有着非常广阔的发展前景。”

而对于定制芯片的未来,亚马逊全球副总裁兼CTO Werner Vogels博士有着这样的预测:“2023年定制芯片的使用将迅速增加。因此,随着工作负载将利用硬件优化来最大限度地提高性能,同时降低能耗和成本,创新的步伐将会进一步加快。”

Werner Vogels博士指出,在消费技术行业,定制芯片和定制硬件因为在性能上的显著提升而获得了迅速发展,但是商业应用程序和系统的情况却并非如此。然而随着定制芯片的普及和采用,这种情况将在未来几年迅速发生改变。亚马逊云科技近年来之所以在芯片设计上投入大量资金,正是因为亚马逊云科技知道客户的工作负载在定制芯片上运行,会具有更好的性能以及更高的成本效益。

“以机器学习工作负载为例,未来几年越来越多的工程师将会看到将工作负载转移到专为模型训练(Amazon Trainium)和推理(Amazon Inferentia)设计的芯片所带来的好处。通过使用基于Trainium的实例实现约50%的训练成本节省,或者使用基于Inferentia2的实例实现50%的每瓦特性能提升,工程师和企业都会注意到,我们将开始工作负载的大规模迁移。而在性能提升以及成本节约上的巨大优势,也将带来更多的实验、创新以及应用,并最终为其他特定工作负载提供更多的定制芯片,从而形成一个良性循环。”Werner Vogels博士表示。


趣味科技v 资深媒体人彭承文和他的小伙伴们耕耘打理的科技自媒体,传播趣味文章,八卦前卫科技,年度十大媒体人,十佳科技自媒体,美通社媒体传播专家,2018平昌冬奥会火炬手.
评论 (0)
  • 在海洋监测领域,基于无人艇能够实现高效、实时、自动化的海洋数据采集,从而为海洋环境保护、资源开发等提供有力支持。其中,无人艇的控制算法训练往往需要大量高质量的数据支持。然而,海洋数据采集也面临数据噪声和误差、数据融合与协同和复杂海洋环境适应等诸多挑战,制约着无人艇技术的发展。针对这些挑战,我们探索并推出一套基于多传感器融合的海洋数据采集系统,能够高效地采集和处理海洋环境中的多维度数据,为无人艇的自主航行和控制算法训练提供高质量的数据支持。一、方案架构无人艇要在复杂海上环境中实现自主导航,尤其是完
    康谋 2025-03-13 09:53 169浏览
  • 北京时间3月11日,国内领先的二手消费电子产品交易和服务平台万物新生(爱回收)集团(纽交所股票代码:RERE)发布2024财年第四季度和全年业绩报告。财报显示,2024年第四季度万物新生集团总收入48.5亿元,超出业绩指引,同比增长25.2%。单季non-GAAP经营利润1.3亿元(non-GAAP口径,即经调整口径,均不含员工股权激励费用、无形资产摊销及因收购产生的递延成本,下同),并汇报创历史新高的GAAP净利润7742万元,同比增长近27倍。总览全年,万物新生总收入同比增长25.9%达到1
    华尔街科技眼 2025-03-13 12:23 150浏览
  • 各大Logo更新汇报 | NEW百佳泰为ISO/IEC17025实验室,特为您整理2025年3月各大Logo的最新规格信息。USB™▶ USB Type-C/PD 互操作性MacBook Pro 16英寸(Apple M4 Max 芯片,36GB 内存–1TB SSD–140W USB-C电源适配器)或 MacBook Pro 16英寸(M4 Pro芯片,24GB内存–512 TB SSD–140W USB-C电源适配器),这些型号支持USB4 80Gbps传输速度和 140W EPR功率。需尽
    百佳泰测试实验室 2025-03-13 18:20 178浏览
  • 在追求更快、更稳的无线通信路上,传统射频架构深陷带宽-功耗-成本的“不可能三角”:带宽每翻倍,系统复杂度与功耗增幅远超线性增长。传统方案通过“分立式功放+多级变频链路+JESD204B 接口”的组合试图平衡性能与成本,却难以满足实时性严苛的超大规模 MIMO 通信等场景需求。在此背景下,AXW49 射频开发板以“直采+异构”重构射频范式:基于 AMD Zynq UltraScale+™ RFSoC Gen3XCZU49DR 芯片的 16 通道 14 位 2.5GSPS ADC 与 16
    ALINX 2025-03-13 09:27 130浏览
  • 本文介绍Android系统主板应用配置默认获取管理所有文件权限方法,基于触觉智能SBC3588行业主板演示,搭载了瑞芯微RK3588芯片,八核处理器,6T高算力NPU;音视频接口、通信接口等各类接口一应俱全,支持安卓Android、Linux、开源鸿蒙OpenHarmony、银河麒麟Kylin等操作系统。配置前提在配置前,建议先将应用配置成系统应用,不然配置后系统每次重启后都会弹窗提示是否获取权限。应用配置成系统应用,可参考以下链接方法:瑞芯微开发板/主板Android系统APK签名文件使用方法
    Industio_触觉智能 2025-03-12 14:34 74浏览
  • 文/杜杰编辑/cc孙聪颖‍主打影像功能的小米15 Ultra手机,成为2025开年的第一款旗舰机型。从发布节奏上来看,小米历代Ultra机型,几乎都选择在开年发布,远远早于其他厂商秋季主力机型的发布时间。这毫无疑问会掀起“Ultra旗舰大战”,今年影像手机将再次被卷上新高度。无意臆断小米是否有意“领跑”一场“军备竞赛”,但各种复杂的情绪难以掩盖。岁岁年年机不同,但将2-3年内记忆中那些关于旗舰机的发布会拼凑起来,会发现,包括小米在内,旗舰机的革新点,除了摄影参数的不同,似乎没什么明显变化。贵为旗
    华尔街科技眼 2025-03-13 12:30 187浏览
  • 前言在快速迭代的科技浪潮中,汽车电子技术的飞速发展不仅重塑了行业的面貌,也对测试工具提出了更高的挑战与要求。作为汽车电子测试领域的先锋,TPT软件始终致力于为用户提供高效、精准、可靠的测试解决方案。新思科技出品的TPT软件迎来了又一次重大更新,最新版本TPT 2024.12将进一步满足汽车行业日益增长的测试需求,推动汽车电子技术的持续革新。基于当前汽车客户的实际需求与痛点,结合最新的技术趋势,对TPT软件进行了全面的优化与升级。从模型故障注入测试到服务器函数替代C代码函数,从更准确的需求链接到P
    北汇信息 2025-03-13 14:43 153浏览
  • 一、行业背景与用户需求随着健康消费升级,智能眼部按摩仪逐渐成为缓解眼疲劳、改善睡眠的热门产品。用户对这类设备的需求不再局限于基础按摩功能,而是追求更智能化、人性化的体验,例如:语音交互:实时反馈按摩模式、操作提示、安全提醒。环境感知:通过传感器检测佩戴状态、温度、压力等,提升安全性与舒适度。低功耗长续航:适应便携场景,延长设备使用时间。高性价比方案:在控制成本的同时实现功能多样化。针对这些需求,WTV380-8S语音芯片凭借其高性能、多传感器扩展能力及超高性价比,成为眼部按摩仪智能化升级的理想选
    广州唯创电子 2025-03-13 09:26 120浏览
  • 现代旅游风气盛行,无论国内或国外旅游,导航装置无疑就是最佳的行动导游;在工作使用上也有部分职业(如:外送服务业)需要依靠导航系统的精准,才能将餐点准确无误的送至客户手上。因此手机导航已开始成为现代生活上不可或缺的手机应用之一。「它」是造成产品潜在风险的原因之一外送服务业利用手机导航,通常是使用手机支架固定在机车上,但行进间的机车其环境并不一定适用于安装手机,因行进间所产生的振动可能会影响部分的功能,进而导致受损。您是否曾在新闻报导中看过:有使用者回报在机车上使用手机架导航会造成相机无法开启?苹果
    百佳泰测试实验室 2025-03-13 18:17 194浏览
  • 引言汽车行业正经历一场巨变。随着电动汽车、高级驾驶辅助系统(ADAS)和自动驾驶技术的普及,电子元件面临的要求从未如此严格。在这些复杂系统的核心,存在着一个看似简单却至关重要的元件——精密电阻。贞光科技代理品牌光颉科技的电阻选型过程,特别是在精度要求高达 0.01% 的薄膜和厚膜技术之间的选择,已成为全球汽车工程师的关键决策点。当几毫欧姆的差异可能影响传感器的灵敏度或控制系统的精确性时,选择正确的电阻不仅仅是满足规格的问题——它关系到车辆在极端条件下的安全性、可靠性和性能。在这份全面指南中,我们
    贞光科技 2025-03-12 17:25 152浏览
  • 文/Leon编辑/cc孙聪颖作为全球AI领域的黑马,DeepSeek成功搅乱了中国AI大模型市场的格局。科技大厂们选择合作,接入其模型疯抢用户;而AI独角兽们则陷入两难境地,上演了“Do Or Die”的抉择。其中,有着“大模型六小虎”之称的六家AI独角兽公司(智谱AI、百川智能、月之暗面、MiniMax、阶跃星辰及零一万物),纷纷开始转型:2025年伊始,李开复的零一万物宣布转型,不再追逐超大模型,而是聚焦AI商业化应用;紧接着,消息称百川智能放弃B端金融市场,聚焦AI医疗;月之暗面开始削减K
    华尔街科技眼 2025-03-12 17:37 245浏览
  • 一、行业背景与需求痛点智能电子指纹锁作为智能家居的核心入口,近年来市场规模持续增长,用户对产品的功能性、安全性和设计紧凑性提出更高要求:极致空间利用率:锁体内部PCB空间有限,需高度集成化设计。语音交互需求:操作引导(如指纹识别状态、低电量提醒)、安全告警(防撬、试错报警)等语音反馈。智能化扩展能力:集成传感器以增强安全性(如温度监测、防撬检测)和用户体验。成本与可靠性平衡:在复杂环境下确保低功耗、高稳定性,同时控制硬件成本。WTV380-P(QFN32)语音芯片凭借4mm×4mm超小封装、多传
    广州唯创电子 2025-03-13 09:24 142浏览
  • DeepSeek自成立之初就散发着大胆创新的气息。明明核心开发团队只有一百多人,却能以惊人的效率实现许多大厂望尘莫及的技术成果,原因不仅在于资金或硬件,而是在于扁平架构携手塑造的蜂窝创新生态。创办人梁文锋多次强调,与其与大厂竞争一时的人才风潮,不如全力培养自家的优质员工,形成不可替代的内部生态。正因这样,他对DeepSeek内部人才体系有着一套别具一格的见解。他十分重视中式教育价值,因而DeepSeek团队几乎清一色都是中国式学霸。许多人来自北大清华,或者在各种数据比赛中多次获奖,可谓百里挑一。
    优思学院 2025-03-13 12:15 171浏览
  • 曾经听过一个“隐形经理”的故事:有家公司,新人进来后,会惊讶地发现老板几乎从不在办公室。可大家依旧各司其职,还能在关键时刻自发协作,把项目完成得滴水不漏。新员工起初以为老板是“放羊式”管理,结果去茶水间和老员工聊过才发现,这位看似“隐形”的管理者其实“无处不在”,他提前铺好了企业文化、制度和激励机制,让一切运行自如。我的观点很简单:管理者的最高境界就是——“无为而治”。也就是说,你的存在感不需要每天都凸显,但你的思路、愿景、机制早已渗透到组织血液里。为什么呢?因为真正高明的管理,不在于事必躬亲,
    优思学院 2025-03-12 18:24 120浏览
  • 2025年,科技浪潮汹涌澎湃的当下,智能数字化变革正进行得如火如荼,从去年二季度开始,触觉智能RK3562核心板上市以来,受到了火爆的关注,上百家客户选用了此方案,也获得了众多的好评与认可,为客户的降本增效提供了广阔的空间。随着原厂的更新,功能也迎来了一波重大的更新,无论是商业级(RK3562)还是工业级(RK3562J),都可支持NPU和2×CAN,不再二选一。我们触觉智能做了一个艰难又大胆的决定,为大家带来两大重磅福利,请继续往下看~福利一:RK3562核心板149元特惠再续,支持2×CAN
    Industio_触觉智能 2025-03-12 14:45 49浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦