亚马逊云科技re:Invent:独一无二的云计算

原创 趣味科技v 2024-12-06 21:08

美国当地时间12月2日晚,作为拥有超过6万名现场参会者和40万名线上参会者的全球云计算顶级盛宴,亚马逊云科技2024 re:Invent全球大会在拉斯维加斯盛大揭幕。

作为本届re:Invent全球大会的首场重头戏,亚马逊云科技高级副总裁Peter DeSantis的主题演讲,也由此被赋予了特殊的意义。

持续不断创新的源动力

众所周知,作为全球云计算技术的开创者,亚马逊云科技不仅在2006年3月正式推出了Amazon EC2弹性计算云服务,并且在之后超过18年的时间里,一直持续引领着全球云计算领域的技术革新。

那么问题就来了:作为一家将创新写入DNA的科技企业,亚马逊云科技持续不断创新的源动力究竟从何而来?

为了形象地阐述这个问题,Peter DeSantis用亚马逊雨林的“树根”来对亚马逊云科技的企业文化进行了比喻。不是所有的树都有树根,然而一棵枝繁叶茂的参天大树,必然有着扎进土壤深处的根系,才能保证树木即使在恶劣的环境下也能茁壮成长。

“亚马逊雨林的扶壁根系,支撑着世界上最大的树木生长在并不稳定的土壤系统中。扶根可以从一棵树的底部延伸数百英尺,并与附近的树木互锁构成一个坚实的基础,来支撑这些巨大的雨林。”Peter DeSantis说道,“而亚马逊云科技最独特的事情之一,是我们的领导者能够在细节上花费大量时间精力,去了解客户和服务真正发生了什么事情,从而能够快速做出决定,甚至有可能在问题发生之前就解决或预防它们。”

Peter DeSantis指出,亚马逊云科技的文化是独一无二的,它帮助企业在扩大规模的同时,还能够保持对安全性能、运营效率、成本和创新的坚定关注,为客户带来不断提升的云计算服务与用户体验。

不断升级的云计算基础设施

通过在自研芯片和系统等领域持续不断的创新,亚马逊云科技在云计算运营性能、安全、成本等方面也积累了独特能力和核心优势。

亚马逊云科技计算与网络副总裁David Brown指出,作为亚马逊云科技旗下的自研芯片系列之一,2018年推出的第一代Amazon Graviton系列芯片就提供了足以媲美x86的优异性能;随后的Amazon Graviton2更是在广泛的工作负载类型中实现了对x86的反超;Amazon Graviton3可以为Nginx等工作负载提供高达60%的性能提升;作为迄今为止性能最强大的Graviton芯片,Graviton4的vCPU数量是Graviton3的3倍,计算性能也较上一代芯片提升了30%。

“在过去的两年中,亚马逊云科技数据中心有超过50%的新增CPU算力都运行在Graviton之上,比其他所有类型的CPU加起来还要多。”David Brown表示。

谈到Amazon Nitro系统时,David Brown表示,Nitro系统通过将大部分虚拟化功能卸载到专用硬件芯片上,极大简化了虚拟机监控程序,消除了传统虚拟化的性能开销。为了确保整个硬件供应链的安全性,Nitro引入了硬件完整性的验证管控机制,从芯片制造阶段开始就对每个硬件组件进行加密认证,从根本上防止了硬件层面的攻击和篡改。

David Brown指出,如果将Nitro系统与Graviton4芯片配合,即可创建一个相互锁定的信任网络,使CPU到CPU、CPU到Nitro芯片的所有连接,都可以由硬件提供安全保护。此外在存储驱动器中嵌入Nitro卡,还可以实现存储和计算分离的架构,使得计算和存储资源能够独立扩展,从而在满足扩容需求的同时,还可以减少故障范围,加快恢复速度,提高存储服务的敏捷性、可靠性和效率。

AI基础设施的创新

在生成式AI大潮席卷全球的今天,亚马逊云科技在AI基础设施领域的创新,也理所当然地成为了业界人士关注的焦点。

Peter DeSantis在主题演讲中指出,伴随着工作负荷的不断增加,人工智能中巨量的计算负载并不能完全通过横向扩展(Scale out)资源来解决,而是也需要纵向扩展单个计算单元的能力(Scale up)。如果只是单纯添加服务器的话,用户不会发现计算变得更快,而只是增加了成本。

强调了数据并行性的限制之后,Peter DeSantis提出了构建AI基础设施的两个基本支柱:“第一,因为我们有从全球批量规模扩展的限制,我们可以通过购买更强大的服务器,来构建更大的AI模型,这是AI基础设施挑战的扩展部分;第二,尽管在构建AI模型时存在扩展的限制,但是我们仍然从构建这些非常大的集群中获得了很多价值,为了做好这一点,我们需要利用多年来一直在构建的扩展工具,譬如高效的数据中心、快速的扩展、强大的网络等等。”

Amazon Trainium2实例正式可用

作为亚马逊云科技旗下的自研芯片系列之一,专门为AI工作负载而设计的Amazon Trainium系列芯片,也因为近年来生成式AI的炙手可热而备受关注。在本届re:Invent大会上,Peter DeSantis也宣布基于Amazon Trainium2的Amazon Elastic Compute Cloud(Amazon EC2)Trn2实例正式可用,同时还推出了全新的Amazon EC2 Trn2 UltraServers,让用户能够以优越的性价比训练和部署最新的AI模型,以及未来的大语言模型(LLM)和基础模型(FM)。

Trainium2采用了先进的封装技术,将计算芯片和高带宽内存(HBM)模块集成在一个紧凑的封装内,实现了CPU和内存的无缝集成,不仅提高了性能,降低了延迟,而且数据交换也更加高效,同时还减少了电压,提高了能效。

与当前基于GPU的EC2 P5e和P5en实例相比,Amazon EC2 Trn2实例的性价比提升30-40%,配备了16个Trainium2芯片,可提供高达20.8万亿次每秒浮点算力的性能,非常适合训练和部署具有数十亿参数的大型语言模型(LLMs)。而Amazon EC2 Trn2 UltraServers更是配备了64个Trainium2芯片,采用亚马逊云科技专有的NeuronLink超速互连技术,可提供高达83.2万亿次每秒浮点算力,其计算、内存和网络能力是单一实例的四倍,能够支持训练和部署超大规模的模型。

“过去我一直想把硬件带到舞台上,但是每年都被说服放弃这一想法。但是今年为了向你们展示什么是超级服务器,我把它带到了舞台上。它能够提供比任何当前的EC2 AI服务器还要多5倍的计算容量和10倍的内存。这就是你要建立一个万亿参数AI模型所需要的服务器。”Peter DeSantis说道。

Amazon Bedrock低延迟优化推理

对于许多企业和开发者来说,Amazon Bedrock无疑是他们拥抱生成式AI时的最佳助手。通过这项完全托管的服务,用户可以非常方便地调用来自AI21 Labs、Anthropic、Cohere、Meta、Stability AI、Mistral AI以及亚马逊云科技的高性能基础模型(FM),以及通过安全性、隐私性和负责任的AI构建生成式AI应用程序所需的一系列功能,使用自己的数据来构建私人订制的生成式AI应用。

在本届re:Invent大会上,Peter DeSantis宣布Amazon Bedrock推出了一项新的低延迟优化推理功能。它让用户能够访问亚马逊云科技最新的AI基础设施和软件优化技术,从而在各种领先的模型上获得最佳的推理性能。

与此同时,亚马逊云科技还与Anthropic合作推出了AI模型Claude 3.5的低延迟优化版本,通过低延迟模式运行Claude Haiku可提速60%。Anthropic联合创始人兼首席计算官Tom Brown还宣布,下一代Claude模型将在Project Rainier上训练。这个集成了数十万个Trn2芯片的集群运算能力是以往集群的5倍多,客户可以用更低价格、更快速度使用更高智能的模型。

构建更大更强的AI集群网络

谈到如何构建大规模AI集群,Peter DeSantis认为网络是一大关键因素。飞速发展的生成式AI和大模型,需要更大的网络带宽,更快的获取网络资源,以及更高的可靠性。这也对网络提出了更高的要求。

为了解决这一问题,亚马逊云科技开发出了面向大规模AI集群的网络架构“10p10u网络”。该网络架构支持对超级服务器进行集群,因而被用于驱动基于UltraSever或NVIDIA节点构建的大规模计算集群,为数以千计的计算节点之间提供数十PB/s的网络带宽,延迟低于10微秒。大规模并行和高密度互连的特点,使得“10p10u网络”可以非常方便地从少量机架快速扩展到跨越多个数据中心的大规模集群,具备极佳的弹性。

“‘10p10u网络’是有史以来规模最快的网络,其斜坡对我们来说也是前所未有。在过去的12个月里我们安装了超过300万个链接,这甚至是在许多人开始关注我们的培训之前。”Peter DeSantis说道。同时他还表示,通过在Graviton、Nitro、存储、网络等核心领域的持续投资和创新,亚马逊云科技正在构建更大、更强的AI服务器集群,以更好地满足客户的需求。


趣味科技v 资深媒体人彭承文和他的小伙伴们耕耘打理的科技自媒体,传播趣味文章,八卦前卫科技,年度十大媒体人,十佳科技自媒体,美通社媒体传播专家,2018平昌冬奥会火炬手.
评论
  • 文/郭楚妤编辑/cc孙聪颖‍相较于一众措辞谨慎、毫无掌舵者个人风格的上市公司财报,利亚德的财报显得尤为另类。利亚德光电集团成立于1995年,是一家以LED显示、液晶显示产品设计、生产、销售及服务为主业的高新技术企业。自2016年年报起,无论业绩优劣,董事长李军每年都会在财报末尾附上一首七言打油诗,抒发其对公司当年业绩的感悟。从“三年翻番顺大势”“智能显示我第一”“披荆斩棘幸从容”等词句中,不难窥见李军的雄心壮志。2012年,利亚德(300296.SZ)在深交所创业板上市。成立以来,该公司在细分领
    华尔街科技眼 2025-05-07 19:25 531浏览
  • 飞凌嵌入式作为龙芯合作伙伴,隆重推出FET-2K0300i-S全国产自主可控工业级核心板!FET-2K0300i-S核心板基于龙芯2K0300i工业级处理器开发设计,集成1个64位LA264处理器,主频1GHz,提供高效的计算能力;支持硬件ECC;2K0300i还具备丰富的连接接口USB、SDIO、UART、SPI、CAN-FD、Ethernet、ADC等一应俱全,龙芯2K0300i支持四路CAN-FD接口,具备良好的可靠性、实时性和灵活性,可满足用户多路CAN需求。除性价比超高的国产处理器外,
    飞凌嵌入式 2025-05-07 11:54 118浏览
  • 随着智能驾驶时代到来,汽车正转变为移动计算平台。车载AI技术对存储器提出新挑战:既要高性能,又需低功耗和车规级可靠性。贞光科技代理的紫光国芯车规级LPDDR4存储器,以其卓越性能成为国产芯片产业链中的关键一环,为智能汽车提供坚实的"记忆力"支持。作为官方授权代理商,贞光科技通过专业技术团队和完善供应链,让这款国产存储器更好地服务国内汽车厂商。本文将探讨车载AI算力需求现状及贞光科技如何通过紫光国芯LPDDR4产品满足市场需求。 车载AI算力需求激增的背景与挑战智能驾驶推动算力需求爆发式
    贞光科技 2025-05-07 16:54 249浏览
  • UNISOC Miracle Gaming奇迹手游引擎亮点:• 高帧稳帧:支持《王者荣耀》等主流手游90帧高画质模式,连续丢帧率最高降低85%;• 丝滑操控:游戏冷启动速度提升50%,《和平精英》开镜开枪操作延迟降低80%;• 极速网络:专属游戏网络引擎,使《王者荣耀》平均延迟降低80%;• 智感语音:与腾讯GVoice联合,弱网环境仍能保持清晰通话;• 超高画质:游戏画质增强、超级HDR画质、游戏超分技术,优化游戏视效。全球手游市场规模日益壮大,游戏玩家对极致体验的追求愈发苛刻。紫光展锐全新U
    紫光展锐 2025-05-07 17:07 422浏览
  • 硅二极管温度传感器是一种基于硅半导体材料特性的测温装置,其核心原理是利用硅二极管的电学参数(如正向压降或电阻)随温度变化的特性实现温度检测。以下是其工作原理、技术特点及典型应用:一、工作原理1、‌PN结温度特性‌硅二极管由PN结构成,当温度变化时,其正向电压 VF与温度呈线性负相关关系。例如,温度每升高1℃,VF约下降2 mV。2、‌电压—温度关系‌通过jing确测量正向电压的微小变化,可推算出环境温度值。部分型号(如SI410)在宽温域内(如1.4 K至475 K)仍能保持高线性度。
    锦正茂科技 2025-05-09 13:52 368浏览
  • 二位半 5线数码管的驱动方法这个2位半的7段数码管只用5个管脚驱动。如果用常规的7段+共阳/阴则需要用10个管脚。如果把每个段看成独立的灯。5个管脚来点亮,任选其中一个作为COM端时,另外4条线可以单独各控制一个灯。所以实际上最多能驱动5*4 = 20个段。但是这里会有一个小问题。如果想点亮B1,可以让第3条线(P3)置高,P4 置低,其它阳极连P3的灯对应阴极P2 P1都应置高,此时会发现C1也会点亮。实际操作时,可以把COM端线P3设置为PP输出,其它线为OD输出。就可以单独控制了。实际的驱
    southcreek 2025-05-07 15:06 723浏览
  • 这款无线入耳式蓝牙耳机是长这个样子的,如下图。侧面特写,如下图。充电接口来个特写,用的是卡座卡在PCB板子上的,上下夹紧PCB的正负极,如下图。撬开耳机喇叭盖子,如下图。精致的喇叭(HY),如下图。喇叭是由电学产生声学的,具体结构如下图。电池包(AFS 451012  21 12),用黄色耐高温胶带进行包裹(安规需求),加强隔离绝缘的,如下图。451012是电池包的型号,聚合物锂电池+3.7V 35mAh,详细如下图。电路板是怎么拿出来的呢,剪断喇叭和电池包的连接线,底部抽出PCB板子
    liweicheng 2025-05-06 22:58 749浏览
  • 后摄像头是长这个样子,如下图。5孔(D-,D+,5V,12V,GND),说的是连接线的个数,如下图。4LED,+12V驱动4颗LED灯珠,给摄像头补光用的,如下图。打开后盖,发现里面有透明白胶(防水)和白色硬胶(固定),用合适的工具,清理其中的胶状物。BOT层,AN3860,Panasonic Semiconductor (松下电器)制造的,Cylinder Motor Driver IC for Video Camera,如下图。TOP层,感光芯片和广角聚焦镜头组合,如下图。感光芯片,看着是玻
    liweicheng 2025-05-07 23:55 622浏览
  • Matter协议是一个由Amazon Alexa、Apple HomeKit、Google Home和Samsung SmartThings等全球科技巨头与CSA联盟共同制定的开放性标准,它就像一份“共生契约”,能让原本相互独立的家居生态在应用层上握手共存,同时它并非另起炉灶,而是以IP(互联网协议)为基础框架,将不同通信协议下的家居设备统一到同一套“语义规则”之下。作为应用层上的互通标准,Matter协议正在重新定义智能家居行业的运行逻辑,它不仅能向下屏蔽家居设备制造商的生态和系统,让设备、平
    华普微HOPERF 2025-05-08 11:40 488浏览
  • 在印度与巴基斯坦的军事对峙情境下,歼10C的出色表现如同一颗投入平静湖面的巨石,激起层层涟漪,深刻印证了“质量大于数量”这一铁律。军事领域,技术优势就是决定胜负的关键钥匙。歼10C凭借先进的航电系统、强大的武器挂载能力以及卓越的机动性能,在战场上大放异彩。它能够精准捕捉目标,迅速发动攻击,以一敌多却毫不逊色。与之形成鲜明对比的是,单纯依靠数量堆砌的军事力量,在面对先进技术装备时,往往显得力不从心。这一现象绝非局限于军事范畴,在当今社会的各个领域,“质量大于数量”都已成为不可逆转的趋势。在科技行业
    curton 2025-05-11 19:09 85浏览
  • 温度传感器的工作原理依据其类型可分为以下几种主要形式:一、热电阻温度传感器利用金属或半导体材料的电阻值随温度变化的特性实现测温:l ‌金属热电阻‌(如铂电阻 Pt100、Pt1000):高温下电阻值呈线性增长,稳定性高,适用于工业精密测温。l ‌热敏电阻‌(NTC/PTC):NTC 热敏电阻阻值随温度升高而下降,PTC 则相反;灵敏度高但线性范围较窄,常用于电子设备温控。二、热电偶传感器基于‌塞贝克效应‌(Seebeck effect):两种不同
    锦正茂科技 2025-05-09 13:31 349浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦