亚马逊云科技re:Invent:独一无二的云计算

原创 趣味科技v 2024-12-06 21:08

美国当地时间12月2日晚,作为拥有超过6万名现场参会者和40万名线上参会者的全球云计算顶级盛宴,亚马逊云科技2024 re:Invent全球大会在拉斯维加斯盛大揭幕。

作为本届re:Invent全球大会的首场重头戏,亚马逊云科技高级副总裁Peter DeSantis的主题演讲,也由此被赋予了特殊的意义。

持续不断创新的源动力

众所周知,作为全球云计算技术的开创者,亚马逊云科技不仅在2006年3月正式推出了Amazon EC2弹性计算云服务,并且在之后超过18年的时间里,一直持续引领着全球云计算领域的技术革新。

那么问题就来了:作为一家将创新写入DNA的科技企业,亚马逊云科技持续不断创新的源动力究竟从何而来?

为了形象地阐述这个问题,Peter DeSantis用亚马逊雨林的“树根”来对亚马逊云科技的企业文化进行了比喻。不是所有的树都有树根,然而一棵枝繁叶茂的参天大树,必然有着扎进土壤深处的根系,才能保证树木即使在恶劣的环境下也能茁壮成长。

“亚马逊雨林的扶壁根系,支撑着世界上最大的树木生长在并不稳定的土壤系统中。扶根可以从一棵树的底部延伸数百英尺,并与附近的树木互锁构成一个坚实的基础,来支撑这些巨大的雨林。”Peter DeSantis说道,“而亚马逊云科技最独特的事情之一,是我们的领导者能够在细节上花费大量时间精力,去了解客户和服务真正发生了什么事情,从而能够快速做出决定,甚至有可能在问题发生之前就解决或预防它们。”

Peter DeSantis指出,亚马逊云科技的文化是独一无二的,它帮助企业在扩大规模的同时,还能够保持对安全性能、运营效率、成本和创新的坚定关注,为客户带来不断提升的云计算服务与用户体验。

不断升级的云计算基础设施

通过在自研芯片和系统等领域持续不断的创新,亚马逊云科技在云计算运营性能、安全、成本等方面也积累了独特能力和核心优势。

亚马逊云科技计算与网络副总裁David Brown指出,作为亚马逊云科技旗下的自研芯片系列之一,2018年推出的第一代Amazon Graviton系列芯片就提供了足以媲美x86的优异性能;随后的Amazon Graviton2更是在广泛的工作负载类型中实现了对x86的反超;Amazon Graviton3可以为Nginx等工作负载提供高达60%的性能提升;作为迄今为止性能最强大的Graviton芯片,Graviton4的vCPU数量是Graviton3的3倍,计算性能也较上一代芯片提升了30%。

“在过去的两年中,亚马逊云科技数据中心有超过50%的新增CPU算力都运行在Graviton之上,比其他所有类型的CPU加起来还要多。”David Brown表示。

谈到Amazon Nitro系统时,David Brown表示,Nitro系统通过将大部分虚拟化功能卸载到专用硬件芯片上,极大简化了虚拟机监控程序,消除了传统虚拟化的性能开销。为了确保整个硬件供应链的安全性,Nitro引入了硬件完整性的验证管控机制,从芯片制造阶段开始就对每个硬件组件进行加密认证,从根本上防止了硬件层面的攻击和篡改。

David Brown指出,如果将Nitro系统与Graviton4芯片配合,即可创建一个相互锁定的信任网络,使CPU到CPU、CPU到Nitro芯片的所有连接,都可以由硬件提供安全保护。此外在存储驱动器中嵌入Nitro卡,还可以实现存储和计算分离的架构,使得计算和存储资源能够独立扩展,从而在满足扩容需求的同时,还可以减少故障范围,加快恢复速度,提高存储服务的敏捷性、可靠性和效率。

AI基础设施的创新

在生成式AI大潮席卷全球的今天,亚马逊云科技在AI基础设施领域的创新,也理所当然地成为了业界人士关注的焦点。

Peter DeSantis在主题演讲中指出,伴随着工作负荷的不断增加,人工智能中巨量的计算负载并不能完全通过横向扩展(Scale out)资源来解决,而是也需要纵向扩展单个计算单元的能力(Scale up)。如果只是单纯添加服务器的话,用户不会发现计算变得更快,而只是增加了成本。

强调了数据并行性的限制之后,Peter DeSantis提出了构建AI基础设施的两个基本支柱:“第一,因为我们有从全球批量规模扩展的限制,我们可以通过购买更强大的服务器,来构建更大的AI模型,这是AI基础设施挑战的扩展部分;第二,尽管在构建AI模型时存在扩展的限制,但是我们仍然从构建这些非常大的集群中获得了很多价值,为了做好这一点,我们需要利用多年来一直在构建的扩展工具,譬如高效的数据中心、快速的扩展、强大的网络等等。”

Amazon Trainium2实例正式可用

作为亚马逊云科技旗下的自研芯片系列之一,专门为AI工作负载而设计的Amazon Trainium系列芯片,也因为近年来生成式AI的炙手可热而备受关注。在本届re:Invent大会上,Peter DeSantis也宣布基于Amazon Trainium2的Amazon Elastic Compute Cloud(Amazon EC2)Trn2实例正式可用,同时还推出了全新的Amazon EC2 Trn2 UltraServers,让用户能够以优越的性价比训练和部署最新的AI模型,以及未来的大语言模型(LLM)和基础模型(FM)。

Trainium2采用了先进的封装技术,将计算芯片和高带宽内存(HBM)模块集成在一个紧凑的封装内,实现了CPU和内存的无缝集成,不仅提高了性能,降低了延迟,而且数据交换也更加高效,同时还减少了电压,提高了能效。

与当前基于GPU的EC2 P5e和P5en实例相比,Amazon EC2 Trn2实例的性价比提升30-40%,配备了16个Trainium2芯片,可提供高达20.8万亿次每秒浮点算力的性能,非常适合训练和部署具有数十亿参数的大型语言模型(LLMs)。而Amazon EC2 Trn2 UltraServers更是配备了64个Trainium2芯片,采用亚马逊云科技专有的NeuronLink超速互连技术,可提供高达83.2万亿次每秒浮点算力,其计算、内存和网络能力是单一实例的四倍,能够支持训练和部署超大规模的模型。

“过去我一直想把硬件带到舞台上,但是每年都被说服放弃这一想法。但是今年为了向你们展示什么是超级服务器,我把它带到了舞台上。它能够提供比任何当前的EC2 AI服务器还要多5倍的计算容量和10倍的内存。这就是你要建立一个万亿参数AI模型所需要的服务器。”Peter DeSantis说道。

Amazon Bedrock低延迟优化推理

对于许多企业和开发者来说,Amazon Bedrock无疑是他们拥抱生成式AI时的最佳助手。通过这项完全托管的服务,用户可以非常方便地调用来自AI21 Labs、Anthropic、Cohere、Meta、Stability AI、Mistral AI以及亚马逊云科技的高性能基础模型(FM),以及通过安全性、隐私性和负责任的AI构建生成式AI应用程序所需的一系列功能,使用自己的数据来构建私人订制的生成式AI应用。

在本届re:Invent大会上,Peter DeSantis宣布Amazon Bedrock推出了一项新的低延迟优化推理功能。它让用户能够访问亚马逊云科技最新的AI基础设施和软件优化技术,从而在各种领先的模型上获得最佳的推理性能。

与此同时,亚马逊云科技还与Anthropic合作推出了AI模型Claude 3.5的低延迟优化版本,通过低延迟模式运行Claude Haiku可提速60%。Anthropic联合创始人兼首席计算官Tom Brown还宣布,下一代Claude模型将在Project Rainier上训练。这个集成了数十万个Trn2芯片的集群运算能力是以往集群的5倍多,客户可以用更低价格、更快速度使用更高智能的模型。

构建更大更强的AI集群网络

谈到如何构建大规模AI集群,Peter DeSantis认为网络是一大关键因素。飞速发展的生成式AI和大模型,需要更大的网络带宽,更快的获取网络资源,以及更高的可靠性。这也对网络提出了更高的要求。

为了解决这一问题,亚马逊云科技开发出了面向大规模AI集群的网络架构“10p10u网络”。该网络架构支持对超级服务器进行集群,因而被用于驱动基于UltraSever或NVIDIA节点构建的大规模计算集群,为数以千计的计算节点之间提供数十PB/s的网络带宽,延迟低于10微秒。大规模并行和高密度互连的特点,使得“10p10u网络”可以非常方便地从少量机架快速扩展到跨越多个数据中心的大规模集群,具备极佳的弹性。

“‘10p10u网络’是有史以来规模最快的网络,其斜坡对我们来说也是前所未有。在过去的12个月里我们安装了超过300万个链接,这甚至是在许多人开始关注我们的培训之前。”Peter DeSantis说道。同时他还表示,通过在Graviton、Nitro、存储、网络等核心领域的持续投资和创新,亚马逊云科技正在构建更大、更强的AI服务器集群,以更好地满足客户的需求。


趣味科技v 资深媒体人彭承文和他的小伙伴们耕耘打理的科技自媒体,传播趣味文章,八卦前卫科技,年度十大媒体人,十佳科技自媒体,美通社媒体传播专家,2018平昌冬奥会火炬手.
评论
  • Ubuntu20.04默认情况下为root账号自动登录,本文介绍如何取消root账号自动登录,改为通过输入账号密码登录,使用触觉智能EVB3568鸿蒙开发板演示,搭载瑞芯微RK3568,四核A55处理器,主频2.0Ghz,1T算力NPU;支持OpenHarmony5.0及Linux、Android等操作系统,接口丰富,开发评估快人一步!添加新账号1、使用adduser命令来添加新用户,用户名以industio为例,系统会提示设置密码以及其他信息,您可以根据需要填写或跳过,命令如下:root@id
    Industio_触觉智能 2025-01-17 14:14 121浏览
  • 随着消费者对汽车驾乘体验的要求不断攀升,汽车照明系统作为确保道路安全、提升驾驶体验以及实现车辆与环境交互的重要组成,日益受到业界的高度重视。近日,2024 DVN(上海)国际汽车照明研讨会圆满落幕。作为照明与传感创新的全球领导者,艾迈斯欧司朗受邀参与主题演讲,并现场展示了其多项前沿技术。本届研讨会汇聚来自全球各地400余名汽车、照明、光源及Tier 2供应商的专业人士及专家共聚一堂。在研讨会第一环节中,艾迈斯欧司朗系统解决方案工程副总裁 Joachim Reill以深厚的专业素养,主持该环节多位
    艾迈斯欧司朗 2025-01-16 20:51 195浏览
  • 日前,商务部等部门办公厅印发《手机、平板、智能手表(手环)购新补贴实施方案》明确,个人消费者购买手机、平板、智能手表(手环)3类数码产品(单件销售价格不超过6000元),可享受购新补贴。每人每类可补贴1件,每件补贴比例为减去生产、流通环节及移动运营商所有优惠后最终销售价格的15%,每件最高不超过500元。目前,京东已经做好了承接手机、平板等数码产品国补优惠的落地准备工作,未来随着各省市关于手机、平板等品类的国补开启,京东将第一时间率先上线,满足消费者的换新升级需求。为保障国补的真实有效发放,基于
    华尔街科技眼 2025-01-17 10:44 221浏览
  • 数字隔离芯片是一种实现电气隔离功能的集成电路,在工业自动化、汽车电子、光伏储能与电力通信等领域的电气系统中发挥着至关重要的作用。其不仅可令高、低压系统之间相互独立,提高低压系统的抗干扰能力,同时还可确保高、低压系统之间的安全交互,使系统稳定工作,并避免操作者遭受来自高压系统的电击伤害。典型数字隔离芯片的简化原理图值得一提的是,数字隔离芯片历经多年发展,其应用范围已十分广泛,凡涉及到在高、低压系统之间进行信号传输的场景中基本都需要应用到此种芯片。那么,电气工程师在进行电路设计时到底该如何评估选择一
    华普微HOPERF 2025-01-20 16:50 73浏览
  • 临近春节,各方社交及应酬也变得多起来了,甚至一月份就排满了各式约见。有的是关系好的专业朋友的周末“恳谈会”,基本是关于2025年经济预判的话题,以及如何稳定工作等话题;但更多的预约是来自几个客户老板及副总裁们的见面,他们为今年的经济预判与企业发展焦虑而来。在聊天过程中,我发现今年的聊天有个很有意思的“点”,挺多人尤其关心我到底是怎么成长成现在的多领域风格的,还能掌握一些经济趋势的分析能力,到底学过哪些专业、在企业管过哪些具体事情?单单就这个一个月内,我就重复了数次“为什么”,再辅以我上次写的:《
    牛言喵语 2025-01-22 17:10 27浏览
  •     IPC-2581是基于ODB++标准、结合PCB行业特点而指定的PCB加工文件规范。    IPC-2581旨在替代CAM350格式,成为PCB加工行业的新的工业规范。    有一些免费软件,可以查看(不可修改)IPC-2581数据文件。这些软件典型用途是工艺校核。    1. Vu2581        出品:Downstream     
    电子知识打边炉 2025-01-22 11:12 46浏览
  • 现在为止,我们已经完成了Purple Pi OH主板的串口调试和部分配件的连接,接下来,让我们趁热打铁,完成剩余配件的连接!注:配件连接前请断开主板所有供电,避免敏感电路损坏!1.1 耳机接口主板有一路OTMP 标准四节耳机座J6,具备进行音频输出及录音功能,接入耳机后声音将优先从耳机输出,如下图所示:1.21.2 相机接口MIPI CSI 接口如上图所示,支持OV5648 和OV8858 摄像头模组。接入摄像头模组后,使用系统相机软件打开相机拍照和录像,如下图所示:1.3 以太网接口主板有一路
    Industio_触觉智能 2025-01-20 11:04 147浏览
  • 嘿,咱来聊聊RISC-V MCU技术哈。 这RISC-V MCU技术呢,简单来说就是基于一个叫RISC-V的指令集架构做出的微控制器技术。RISC-V这个啊,2010年的时候,是加州大学伯克利分校的研究团队弄出来的,目的就是想搞个新的、开放的指令集架构,能跟上现代计算的需要。到了2015年,专门成立了个RISC-V基金会,让这个架构更标准,也更好地推广开了。这几年啊,这个RISC-V的生态系统发展得可快了,好多公司和机构都加入了RISC-V International,还推出了不少RISC-V
    丙丁先生 2025-01-21 12:10 108浏览
  •  光伏及击穿,都可视之为 复合的逆过程,但是,复合、光伏与击穿,不单是进程的方向相反,偏置状态也不一样,复合的工况,是正偏,光伏是零偏,击穿与漂移则是反偏,光伏的能源是外来的,而击穿消耗的是结区自身和电源的能量,漂移的载流子是 客席载流子,须借外延层才能引入,客席载流子 不受反偏PN结的空乏区阻碍,能漂不能漂,只取决于反偏PN结是否处于外延层的「射程」范围,而穿通的成因,则是因耗尽层的过度扩张,致使跟 端子、外延层或其他空乏区 碰触,当耗尽层融通,耐压 (反向阻断能力) 即告彻底丧失,
    MrCU204 2025-01-17 11:30 179浏览
  • 高速先生成员--黄刚这不马上就要过年了嘛,高速先生就不打算给大家上难度了,整一篇简单但很实用的文章给大伙瞧瞧好了。相信这个标题一出来,尤其对于PCB设计工程师来说,心就立马凉了半截。他们辛辛苦苦进行PCB的过孔设计,高速先生居然说设计多大的过孔他们不关心!另外估计这时候就跳出很多“挑刺”的粉丝了哈,因为翻看很多以往的文章,高速先生都表达了过孔孔径对高速性能的影响是很大的哦!咋滴,今天居然说孔径不关心了?别,别急哈,听高速先生在这篇文章中娓娓道来。首先还是要对各位设计工程师的设计表示肯定,毕竟像我
    一博科技 2025-01-21 16:17 95浏览
  • 80,000人到访的国际大展上,艾迈斯欧司朗有哪些亮点?感未来,光无限。近日,在慕尼黑electronica 2024现场,ams OSRAM通过多款创新DEMO展示,以及数场前瞻洞察分享,全面展示自身融合传感器、发射器及集成电路技术,精准捕捉并呈现环境信息的卓越能力。同时,ams OSRAM通过展会期间与客户、用户等行业人士,以及媒体朋友的深度交流,向业界传达其以光电技术为笔、以创新为墨,书写智能未来的深度思考。electronica 2024electronica 2024构建了一个高度国际
    艾迈斯欧司朗 2025-01-16 20:45 405浏览
  •  万万没想到!科幻电影中的人形机器人,正在一步步走进我们人类的日常生活中来了。1月17日,乐聚将第100台全尺寸人形机器人交付北汽越野车,再次吹响了人形机器人疯狂进厂打工的号角。无独有尔,银河通用机器人作为一家成立不到两年时间的创业公司,在短短一年多时间内推出革命性的第一代产品Galbot G1,这是一款轮式、双臂、身体可折叠的人形机器人,得到了美团战投、经纬创投、IDG资本等众多投资方的认可。作为一家成立仅仅只有两年多时间的企业,智元机器人也把机器人从梦想带进了现实。2024年8月1
    刘旷 2025-01-21 11:15 337浏览
  • 2024年是很平淡的一年,能保住饭碗就是万幸了,公司业绩不好,跳槽又不敢跳,还有一个原因就是老板对我们这些员工还是很好的,碍于人情也不能在公司困难时去雪上加霜。在工作其间遇到的大问题没有,小问题还是有不少,这里就举一两个来说一下。第一个就是,先看下下面的这个封装,你能猜出它的引脚间距是多少吗?这种排线座比较常规的是0.6mm间距(即排线是0.3mm间距)的,而这个规格也是我们用得最多的,所以我们按惯性思维来看的话,就会认为这个座子就是0.6mm间距的,这样往往就不会去细看规格书了,所以这次的运气
    wuliangu 2025-01-21 00:15 178浏览
  • 本文介绍瑞芯微开发板/主板Android配置APK默认开启性能模式方法,开启性能模式后,APK的CPU使用优先级会有所提高。触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。源码修改修改源码根目录下文件device/rockchip/rk3562/package_performance.xml并添加以下内容,注意"+"号为添加内容,"com.tencent.mm"为AP
    Industio_触觉智能 2025-01-17 14:09 161浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦