Orion:谷歌的新一代SDN控制器

鲜枣课堂 2021-12-22 20:29
时至今谷歌在2015年公布的成果,“利用SDN将广域网带宽利用率提升至接近100%,仍然是SDN的一个标杆案列,也是难以逾越的巅峰。但事实上,当时使用的SDN控制器Onix,早已退出了历史舞台。

在今年的NSDI会议上,谷歌发表论文,详细阐述了其第二代SDN控制器Orion的设计原则、整体架构和在生产网络中的应用情况。

尽管是最近才发表的论文,但Orion已经在现网中运行了四年,可谓是“久经考验”。

今天这篇文章会分为几个部分,包括介绍谷歌网络的整体情况,回顾第一代SDN控制器Onix,简要阐述谷歌新一代SDN控制器Orion的情况和几个重要的设计考虑。


谷歌网络情况简介



如图所示,谷歌的网络主要分成三大部分,B4、B2(也叫Espresso)以及Jupiter。

其中B4是谷歌的数据中心互联网络,连接了谷歌全球的数据中心。B2是谷歌面向互联网的网络,负责将用户业务从全球各地的POP点引入到数据中心。而Jupiter,则是谷歌数据中心的内部网络。

这里再补充谈一下谷歌网络承载的业务流量属性。

直到现在,很多运营商专家都表示谷歌的流量基本是自有业务,因此可控性好,更适合SDN。而运营商网络的流量情况,则过于复杂。

事实上,随着谷歌产品线的扩展,尤其是云服务业务的增长,谷歌网络内的流量不可预测性也在不断提升。很大一部分流量,已经不再是自有业务。


谷歌的第一代SDN


谷歌的第一代SDN控制器Onix,总的来说有这么几点值得注意:

一是Onix本身是合作研发而非自研,二是Onix的引入是一个循序渐进的过程,三是Onix是一个单体(molonithic)程序。

Onix的研发是Nicara、NEC和谷歌合作进行的,甚至Nicara的专家还扮演了非常重要的角色。但到了Orion,从论文上看,作者已经是清一色的谷歌员工。可以说谷歌的网络团队在这几年中是在飞速成长的。

Onix投产的过程,也是循序渐进的,大概花了三年完成切换。

第一阶段是2010年开始引入openflow交换机,但新交换机对外的表现和传统交换机一样,只是网络协议运算在controller而不是设备本身完成。第二阶段是一个漫长的流量切换过程。直到2012年开始,流量才完全切换到openflow网络。

Onix作为一个单体程序,其很多固有局限性基本无法解决,这也是Orion出现的理由。

单体程序在稳定性和开发速度上,都存在很大的劣势。以谷歌的实力发布一个新版本都需要5个月,这个节奏和业务发展是明显不相称的。

微服务版本的Orion上线后,两周就可以发布一个版本,并且还有望提升到一周。分布式程序稳定性大增,控制器完全崩溃的几率变得更小。


Orion的整体情况



Orion本身的工作模式,一个词总结,就是调和(reconciliation)

一方面,Orion接收网络管理方(人或者上层应用)的意图并层层翻译。另一方面,不断地感知当前网络的实际运行状态,然后将网络的运行状态逐渐调整向管理方意图靠拢。

从设计的根本原理上看,和Kubernetes的原理几乎一致。

而从架构上看,Orion则是一个典型的微服务应用。

最上层是各种具体的网络应用,如负责域内算路的Routing Engine以及负责BGP广播的Raven等。

中间的核心层主要实现了控制器的通用功能,包括一个集中的NIB数据库(兼具消息队列功能)和负责处理配置、拓扑及流表生成的管理器,以及用于和路由器通信的OFE。

各个模块之间都是微服务,主要通过NIB承载的消息进行交互,这也很好的保障了故障隔离性及开发的可协调性。

值得注意的是,Orion控制的所有路由器均只有openflow协议栈,没有传统协议栈,包括BGP信息的广播和接收,都是在控制器上完成,可以说彻底实现了SDN化。

当然,出于安全性的考虑,Orion并不是一点集中的控制器,而是分域部署的。这在牺牲一些全局性带来的优势(如算路更优,流表更新更快等)的同时,也最大程度确保了网络的健壮性。


Orion的设计考虑


作为面向超大规模生产网络的控制器,意图驱动(intent-based)是必然选择。

谷歌表示宏观的意图远比细锁的过程更稳定,更不容易出错。因此Orion本身就被设计为一个逐层翻译和细化意图的控制器,最终会将管理人员的意图翻译为交换机可识别的openflow原语(primitives)。

Orion处理故障的原则也非常值得学习:对于小问题积极处理,对于大问题则直接躺平(不干涉数据面状态)。


如图所示,一个数据流自顶向下的三层路由器网络中,如果感知到2个路由器损坏,则Orion会牵引流量绕开损坏的路由器,这就是fail-closed。

而如果感知到四个路由器都损坏了,则Orion不会再做任何操作,保持数据面当前状态,也就是fail-static。

这是因为一方面小问题Orion可以在不影响现网流量的情况下进行处理,但大问题的处理则会严重影响现有业务;另一方面数据面出现大问题的几率其实很小,更大的可能是管理通道或者控制器本身出现问题,因此感知到大面积故障误报的可能性很大。

最后一点是关于管理通道的问题。

一般认为带外管理因为具有单独的管理通道,会是更可靠的方式。但管理通道本身也可能损坏,且大量网元均通过带外管理也会产生巨大的成本。

因此,Orion采用了带内管理和带外管理相结合的方式:一方面只对重要设备进行带外管理,这样节省了大量成本;另一方面带内管理和带外管理互为备份,避免管理通道的损坏导致网元彻底脱管。      


结语


网络运营,追求的无非是安全和高效。

SDN本身就是为了高效而生的,经过业界多年的实践,这一点已经没有太大的争议,其效率的提升是实实在在的。而现在争议最大的,主要聚焦在安全和实施成本上。

考虑到网络的自然迭代,成本其实不是问题,逐步转型就好。谷歌也不是一夜之间把路由器都替换掉的。

而安全方面,我想谷歌的论文以及业界的其他实践,已经解答了很多技术上的问题。剩下的问题,更多是意识层面的:是靠算法调度流量更安全,还是深夜的双人割接更安全?是靠经验反复分析、层层把关的割接报告更可靠,还是软件自动计算的drain analysis更准确?

这些问题的答案并不是那么显然,因为安全的定义其实是很复杂的。


这几年来,在网络智能化上,笔者也做了一些微小的工作。总的来说,遇到的困难不少,取得的成果也不算大。但我仍然坚信,SDN就是未来。毕竟,梦想还是要有的。


(全文完)


鲜枣课堂 学通信,学5G,就上鲜枣课堂!
评论
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 227浏览
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 122浏览
  • 「他明明跟我同梯进来,为什么就是升得比我快?」许多人都有这样的疑问:明明就战绩也不比隔壁同事差,升迁之路却比别人苦。其实,之间的差异就在于「领导力」。並非必须当管理者才需要「领导力」,而是散发领导力特质的人,才更容易被晓明。许多领导力和特质,都可以通过努力和学习获得,因此就算不是天生的领导者,也能成为一个具备领导魅力的人,进而被老板看见,向你伸出升迁的橘子枝。领导力是什么?领导力是一种能力或特质,甚至可以说是一种「影响力」。好的领导者通常具备影响和鼓励他人的能力,并导引他们朝着共同的目标和愿景前
    优思学院 2025-01-08 14:54 80浏览
  • 本文介绍编译Android13 ROOT权限固件的方法,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。关闭selinux修改此文件("+"号为修改内容)device/rockchip/common/BoardConfig.mkBOARD_BOOT_HEADER_VERSION ?= 2BOARD_MKBOOTIMG_ARGS :=BOARD_PREBUILT_DTB
    Industio_触觉智能 2025-01-08 00:06 100浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 145浏览
  • PLC组态方式主要有三种,每种都有其独特的特点和适用场景。下面来简单说说: 1. 硬件组态   定义:硬件组态指的是选择适合的PLC型号、I/O模块、通信模块等硬件组件,并按照实际需求进行连接和配置。    灵活性:这种方式允许用户根据项目需求自由搭配硬件组件,具有较高的灵活性。    成本:可能需要额外的硬件购买成本,适用于对系统性能和扩展性有较高要求的场合。 2. 软件组态   定义:软件组态主要是通过PLC
    丙丁先生 2025-01-06 09:23 100浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 126浏览
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 161浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 172浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 96浏览
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 113浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 211浏览
  • 故障现象一辆2017款东风风神AX7车,搭载DFMA14T发动机,累计行驶里程约为13.7万km。该车冷起动后怠速运转正常,热机后怠速运转不稳,组合仪表上的发动机转速表指针上下轻微抖动。 故障诊断 用故障检测仪检测,发动机控制单元中无故障代码存储;读取发动机数据流,发现进气歧管绝对压力波动明显,有时能达到69 kPa,明显偏高,推断可能的原因有:进气系统漏气;进气歧管绝对压力传感器信号失真;发动机机械故障。首先从节气门处打烟雾,没有发现进气管周围有漏气的地方;接着拔下进气管上的两个真空
    虹科Pico汽车示波器 2025-01-08 16:51 86浏览
  •  在全球能源结构加速向清洁、可再生方向转型的今天,风力发电作为一种绿色能源,已成为各国新能源发展的重要组成部分。然而,风力发电系统在复杂的环境中长时间运行,对系统的安全性、稳定性和抗干扰能力提出了极高要求。光耦(光电耦合器)作为一种电气隔离与信号传输器件,凭借其优秀的隔离保护性能和信号传输能力,已成为风力发电系统中不可或缺的关键组件。 风力发电系统对隔离与控制的需求风力发电系统中,包括发电机、变流器、变压器和控制系统等多个部分,通常工作在高压、大功率的环境中。光耦在这里扮演了
    晶台光耦 2025-01-08 16:03 75浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 127浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦