阿里云超大规模边缘容器云助力应用全球化部署

原创 EdgeMaster 2024-04-16 10:11

在全球业务拓展的浪潮下,企业追求全球化不仅意味着市场的扩张,也代表着技术实力的较量。边缘容器云作为企业实现全球战略的重要支撑,正在被越来越多富有远见的企业所采用。它们依托于边缘容器云的技术,将应用部署于世界各地,以期在保证极致用户体验的同时,实现敏捷响应市场变化。透过边缘容器云,这些企业得以突破传统数据中心的限制,克服地理和网络延迟的挑战,顺应全球数据治理的趋势,从而在复杂多变的国际市场中抢占先机,提升其竞争力。


近日,第十四届亚太内容分发大会在北京召开。阿里云技术专家邓茜在峰会上发表演讲,以《超大规模边缘容器云助力应用全球化部署》为主题,分享了阿里云超大规模边缘容器云如何帮助企业在全球拓中快速部署全球化应用。


为什么在已有强大中心云算力的情况下,企业仍需边缘云?


通常大家比较熟悉的一种部署模式就是云、边、端这三种层次,那么有了非常大的算力存储的中心云为什么还需要边缘云呢?在这种云端部署的模式下,我们也可以看到客户会面临非常多的问题。


首先从网络层面来讲,云端的网络延迟和抖动都是非常大的。如果我们把所有的算力都集中在中心,那么中心云将会面临非常大的并发,资源的挑战还有资源的成本也是非常高的,我们是否可以把这个算力往终端去做移动,终端主要一个特点就是算力非常小,可以用的计算、存储这些资源都是非常有限的,比如玩游戏的时候玩不了多久手机就会发热。还有一个思路企业是否可以自己构建一个比较自用的边缘云,首先边缘的规模非常小,而且分布也是非常的广,如果每个企业都走这种自建的模式它的周期非常长,而且没有办法保证边缘云的利用率,因此才有了我们边缘云。


边缘云我们的目的主要就是去做一个非常大面积的覆盖,给用户提供这种低延迟的服务,主要提升用户使用的效率,算力交付的效率,降低企业用户计算的成本,给用户来更低延迟,更高效的体验。


总体来说,阿里云边缘云就是一朵有大规模的地域分散的边缘节点相互协同组成的一朵可以远程管控、安全可信、标准应用的分布式云。

  • 边缘云作为一种部署模式,旨在解决中心云部署模式下的网络延迟和抖动问题。
  • 边缘云通过大规模覆盖提供低延迟服务,提升用户使用效率和算力交付效率,降低企业计算成本。
  • 阿里云边缘云是一个由大规模地域分散的边缘节点组成的分布式云,具有远程管控、安全可信、标准应用的特点。


边缘云节点规模巨大,如何纳管底层异构资源?


首先看一下边缘容器云整体的分层结构,可以从下往上看,在最底层的是我们自建CDN的节点,ENS的节点或者是一些第三方接入的节点,它的形态主要有物理机、VM、ARM阵列。通过容器云纳管可以把所有底层资源做一个并池云化,在这个基础之上我们再提供统一的计算、存储、网络、安全、管控这些能力。


在这个边缘节点服务 ENS基础之上提供PaaS平台的能力,主要利用容器云的平台去做边缘应用的托管,边缘的镜像服务、网格等这些基础的能力,在这个基础之上再去对接OpenAPI去对接控制台提供给用户来使用。

刚才提到了边缘云节点的规模非常巨大,我们如何纳管这些底层异构资源呢?整个边缘云集群的架构是一个两层的分层的架构,最底层是真实物理节点资源,纳管这些物理节点资源的集群我们称之为边缘的管控集群,那这些管控集群也和物理资源比较类似,是分布在全球各个大区的,分布非常广。


在此基础之上,最上层提供给用户的租户集群是用户可见的集群,每一个租户集群可以实际使用的底层资源其实是刚才提到全球所有的边缘节点,每个用户可以看到的也是这么多个节点,用户可以在租户集群里面提出一些具体的部署需求。比如说我想要在全球范围内部署多少个副本,要调度到全球范围内不同的城市,提出这些资源部署需求之后,通过中间全域融合调度还有同步生产的体系,就可以把这些真实用户的应用分布到底层实际的全球各地的节点上面去。

  • 边缘容器云的分层结构包括自建CDN节点、ENS节点和第三方接入节点。
  • 提供统一的计算、存储、网络、安全、管控能力,并在此基础上提供PaaS平台能力。
  • 边缘云集群架构采用两层分层,底层是物理节点资源,上层是用户可见的租户集群。
  • 通过全域融合调度和同步生产体系,可将用户应用分布到全球各地的节点上。


如何提升大规模边缘节点的管控效率?


我们在针对这些不同的边缘节点管理的时候也做了一些非常多的策略提升管控的效率,首先就是这个边缘节点资源接入的时候我们会去请求一个资源管理中心,这个资源管理中心会做统一的集群规划还有配置管理,最后把边缘节点注册到管控集群里面去。


在这个基础之上,因为我们边缘节点分布广也会遇到非常多的问题,比如说在不同的海外节点、国内节点他们的网络环境会遇到非常多的差异,甚至是底层的环境也有非常多的差异。如何保证管控有效性呢,首先在Node接入的过程中会去做一些动态探测的逻辑,我们有非常多的边缘集群,具体这个边缘节点要接入到哪个边缘集群会做一个动态的探索和规划,以提升边缘集群的利用率。因为边缘和集群之间会有非常多可能有一些网络的抖动,我们也添加了很多边缘自治的策略,做一些断网的防护,不会因为短暂的一些断网的情况把用户的应用清除掉。


其实边缘Node网络环境是最未知的,它可能是一些国内外小运营商等等,它和边缘管控集群之间的网络我们也通过自家的产品做了一个四层的动态加速,保证这个集群和Node之间的通信是通畅的。和别的一些中心提供的基础的服务之间我们也是全域都走了自家的CDN进行加速,保证边缘和中心的管控之间通信是非常流畅的。


边缘节点可能会产生一些异常的情况,需要有一些运维和监控的能力,我们在每一个边缘Node上都会去部署一个边缘的监控agent,实时地上报心跳,采集边缘监控的数据,和下发一些运维的动作。

  • 边缘节点资源接入时,通过资源管理中心进行集群规划和配置管理。
  • 动态探测逻辑确保边缘节点有效接入最合适的边缘集群。
  • 边缘自治策略和四层动态加速保证集群和边缘节点之间的通信通畅。
  • 边缘节点上部署监控agent进行实时监控和运维动作。


如何加固边缘容器云管控的稳定性和进行异常诊断?


接下来我再介绍一下我们针对于在实际的边缘容器云这个集群管控的过程中遇到的一些误删等异常操作或异常事件做的一些稳定性的加固。我个人感觉非常有用的一点就是我们的风控系统。风控顾名思义就是做一些风险的控制,比如说人为的误操作或者是因为软件的异常会触发一些误删除的动作,我们的风控系统其实是可以让用户自主的去配置一些风控的策略。比如说我在一段时间内我不允许任何破的有删除或者在30分钟之内我只允许删除一个副本,类似的这种风控策略,可以有效的保证在用户不允许删除任何资源的情况下,你的应用可以非常平稳持续运行在我们边缘云的平台上。


整个边缘容器云的平台里面每天都会遇到非常多异常问题,比如说边缘的Node系统异常、磁盘异常或者网络异常等等的问题,这么庞大的系统如果都人工去处理的话,对我们来说人力的消耗是非常难以接受的,所以我们也构建了一个异常诊断的系统,这个诊断系统会实时监控Node的这种异常状态,再去做一个异常的诊断。


这个异常的诊断可能会去请求一些中心的接口或者边缘的接口,去获取一些不同组件的运行日志,最后会根据当前各种异常的情况做一个根因推导,最后根据推导结果和提前的预设流程会去做一些自动化运维的动作,做自动化的恢复。


如果恢复不了的话再告警到人工去进行处置,异常诊断系统每天可能会有上万次的诊断和上千次自动运维的动作,非常有效的节省了运维人力。

  • 风控系统允许用户配置策略以防止误操作和误删除。
  • 异常诊断系统实时监控Node异常状态,进行诊断和自动化运维动作。


阿里云边缘容器落地实例


云游戏和机顶盒流化场景:

首先云游戏和机顶盒等终端轻化场景是一个典型场景,其中边缘终端的能力与资源受限。通过将计算任务卸载至边缘节点,利用边缘节点,我们可以把用户与节点间的延迟控制在10毫秒以内,极大地提高对实时性要求苛刻业务的支持。这得益于阿里云丰富的硬件资源,包括多样化的板卡和GPU设备,可以用于加速终端计算,提升用户体验。


域名级别的API服务:


第二种比较典型的应用场景就是通过边缘的Serverless技术提供域名级别的API服务。一般域名服务集中部署于中心节点,但部分计算任务适宜分布式部署,无需全部集中化。我们可以将这些任务直接分布至边缘节点,使服务更接近用户。


借助边缘容器云平台,我们在部署完应用后,可以为其自动绑定公网IP对外提供服务,通过域名系统绑定IP和DNS解析实现流量调度。


这得益于我们在CDN领域的深厚经验,我们能够对用户的域名进行精确的流量分配,消除了用户自行管理各个节点和公网IP的复杂性。


日志预处理:


另一个边缘云应用示例是日志的预处理。通常边缘设备会生成大量运行日志,这些日志需要传回中央服务器处理,而日志数据的带宽需求很高。通过在边缘设施部署处理逻辑,可以对日志进行清洗、压缩和预处理。


这一预处理后的数据再传输至中央服务器,显著降低了边缘云与中心云之间的数据传输带宽消耗,从而减少成本。由于带宽价格昂贵,这种做法既节约了中心服务器的宽带资源,又缩短了末端到边缘的传输距离,提升了日志上传效率。


这得益于我们利用CDN节点提供服务,可以充分利用CDN下行带宽成本高但上行相对便宜的特点,节省额外成本,实现中心带宽成本的有效节约。


全链路压测场景:


最后一个例子是全链路压测场景,其目标是模拟大规模用户活动,特别是在大规模促销活动中快速生成海量边缘终端模拟请求。这些模拟请求用于对中心服务器进行压力测试。CDN节点因广泛分布且与用户位置接近,能够有效地进行此类端到端的模拟。


压测任务本身也可进行时间优化,即在网络非高峰时间段执行,以节省带宽和计算资源消耗。对CDN而言,这样的调度可以有效减少成本负担。

EdgeMaster 分享边缘云及CDN领域前沿动态
评论
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 146浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 104浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 131浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 74浏览
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 173浏览
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 124浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 87浏览
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 83浏览
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 48浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 76浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦