汽车行业可靠性实践:符合安全标准的冗余设计

可靠性杂坛 2020-02-20 00:00


文章来源于:公众号可靠性知识

可靠性小知识




什么是冗余设计?

冗余设计又称余度设计技术,是指在系统或设备完成任务起关键作用的地方,增加一套以上完成相同功能的功能通道、工作元件或部件,以保证当该部分出现故障时,系统或设备仍能正常工作,减少系统或者设备的故障概率,提高系统可靠性。




冗余设计一般应用在哪里?


在关键控制系统中,比如卫星控制系统、飞机及机场控制系统、铁路控制系统等,对系统的可靠性有苛刻的要求。在这些系统中,所有组件都要求有冗余设计,包括任何硬件及软件环节,要求任何单点故障不影响系统正常运行,即使是关键节点故障,系统中其他部分也要求具备基本的应急功能。

以下正文


一般来说,可以通过对系统质量、可靠性、可用性、维修性、及安全性等指标做出评测,来衡量系统在环境中的性能。功能安全是系统相对于可能出现的操作错误、硬件故障及环境变化的整体安全性。这取决于系统或设备能否响应输入正确地运行,包括安全地管理操作错误、硬件故障和环境变化。功能安全的目标是避免不可接受的身体伤害,或对健康直接或间接造成的损害风险。


为了确保安全功能能够符合设计初衷,包括在操作员输入不正确和故障模式等情况下,人们一直不断改进各种标准。IEC61508是适用于各个行业的国际功能安全标准之一,名称是“电气/电子/可编程电子安全相关系统的功能安全(E/E/PE或E/E/PES)”。ISO 26262是从IEC 61508衍生而来的功能安全标准,名称为“道路车辆-功能安全”,适用于汽车行业。ISO 26262定义了汽车设备的功能安全,适用于所有汽车电子电气安全相关系统的整个生命周期。


SoC系统级芯片遵循多种设计技术,以符合安全标准,这些在ISO-26262标准中都有所介绍。冗余、自检机制、信号监测、电压电源监测和“看门狗”是在符合安全标准的设备中所使用的几种技术。冗余是这些设备的主要组成部分。冗余在汽车设备中的使用有多种方式,许多符合安全标准的设备将锁步、ECC、CRC及校验等用作冗余技术。

本文将主要介绍SoC中使用到的冗余技术,包括硬件、软件、信息和时间冗余等。


汽车硬件冗余机制

冗余是指除了在关键功能中使用的组件外,还包含额外的组件,旨在提高系统的可靠性和可用性。冗余的添加方式有很多,如硬件(例如双核锁步)冗余、软件冗余、信息冗余(例如将ECC添加到存储器)和时间冗余。一般情况下,冗余依据MooN概念工作。


N分之M(M-out-of-N,MooN)系统包含N个相同的组件,工作原理是:如果N个组件中的至少M个组件正常工作,那么该系统没有错误。一个示例是三重模块化冗余(TMR),这实际上是一个三分之二(2oo3)系统。如果3个组件中至少有两个组件(大部分)正常运行,那么该系统则被视为正常运行。


MooN系统在硬件和软件中使用。在硬件中,关键组件被复制,根据多数投票原则做出决策。而在软件中,一个任务被重复多次,然后比较任务执行结果,生成最后结果。在SoC中,硬件冗余可以采用多种形式:复制执行安全关键任务的内核(也称为锁步)、延迟锁步(1oo1系统)、非对称锁步、三次投票(2oo3系统)。


在符合安全标准的高级设备中,执行安全关键任务的内核被复制,应用在锁步模式下运行这两个内核,比较结果,确保冗余处理产生完全相同的结果。如未获得完全相同的结果,则视为发生了故障。


在锁步模式下,同时将同一组输入发送到这两个内核,然后这两个内核在相同的时钟周期内执行相同的计算,定期比较结果,检测是否发生了故障(无论是瞬时故障、间歇性还是永久性故障)。一旦输出不匹配,通常会标记故障并执行重启。图1显示了锁步中的内核(双核锁步)。

图1:锁步中的内核(双核锁步)工作原理


延迟锁步是锁步的一种,其中一个内核的输入延迟了N个时钟周期,另一个内核的输出也延迟了相同的时间,然后比较结果。用这种方法,可获得时间分集。由于一个内核在N个时钟周期后将执行相同的运算,冲击这两个内核并以相同的方式影响其功能的噪声脉冲的概率将大大减少。图2显示了延迟锁步的工作配置。馈送给内核2的数据被延迟了两个时钟周期。内核2的重置也延迟了两个周期。内核1的输出延迟了两个时钟周期,然后由校验器电路进行比较。如发现故障,则标记错误。

 图2: 延迟锁步的工作配置


在非对称冗余中,不复制相同的内核,而是使用不同的内核。不同的专用内核通过一个接口与主内核紧密耦合,实现内部和外部结果的逐步比较。该接口降低了复杂性,缩短了错误检测延迟。主核执行关键的任务,而专用的多样化内核则复制足够多的主核执行,确保能够检测故障,或确保主核的安全运行。由于硬件的多样性,可以有效覆盖共因故障和系统故障。内核的不同结构将导致不同的内核反应方法,改善共因故障的诊断覆盖。因此这两个内核发生的同类故障的情况将减少。并行通道无需单独的代码,专用内核比主核小。有时,主核的面积差异可高达50%及以上。这种方法的缺点是,可能需要详细的分析来证明诊断覆盖。


此类冗余在位级实施,安全关键任务中所使用的寄存器位被复制两次,根据多数投票逻辑生成输出。这是2oo3多数投票系统的一个示例,如果这三个触发器中的任何一个发生故障,那么其余的两个触发器将掩盖故障。假设很难同时损坏这三个触发器中的两个,那么这种技术可保持系统运行。由于在这种情况下,面积补偿是双倍的,因此需要彻底检验设计配置位,确定安全关键的配置信息,避免任何不必要的面积开销。


软件多样化冗余

在软件冗余中,将在软件中执行该任务多次。可使用不同的软件执行该任务多次(不同的算法用于同一个任务),然后比较结果,这将改善诊断覆盖。


设计中使用两种完全不同的软件实现,即在一个处理单元中使用不同的算法来执行相同的任务。图3说明了实现情况。主用通道负责计算,如果计算错误,可能导致危险。冗余通道负责检验主用通道的计算,如果发现故障则采取行动。冗余通道采用单独的算法设计和代码实现,以提供软件多样化。一旦两条通道都完成后,则比较这两种冗余软件实现的输出数据。如发现差异,则生成故障消息。

 图3:单一硬件通道软件冗余工作原理


算法多样化示例包括:A+B=C与C-B=A。一个通道使用正常的计算,另一个通道使用二进制补码数学。


两个处理单元相互交换数据(包括结果、中间结果和测试数据),在每个单元中使用软件比较数据,如检测到差异则生成故障消息。图4说明了实现情况。在这种情况下,主用通道和冗余通道在不同的处理单元中使用不同的软件算法来执行。如果使用不同的处理器类型以及单独的算法设计、代码和编译器,那么这种方法允许硬件和软件多样性。另外,外设复制与内核复制不同。外设共享外部世界的相同输入,外设的输出在软件中进行比较。例如,在SoC中使用多个ADC,输入信道被复制到大多数ADC,它们的输出可在软件中进行比较。

图4:多处理单元软件冗余工作原理


信息冗余和时间冗余

信息冗余是指在通过嘈杂的信道传输信息时添加到实际数据中的冗余数据,目的是检测故障或修复故障。下面介绍了几种信息冗余方案,如:奇偶校验位、校验和、纠错码。


奇偶校验位是指被添加到二进制数据结尾的位,指示数据中“1”的数量是奇数还是偶数。偶校验方案是指如果数据中“1”的数量为奇数,则向数据添加一个“1”。奇校验方案是指,如果数据中“1”的数量为偶数,则向数据添加一个“1”。例如,如果实际数据为“11110000 0000”,并且在其后添加了一个偶校验位,那么“1111000000000 0”将通过通信信道传输。在接收器端,如果收到单个的位触发数据,那么接收器将检测到数据在传输过程中被破坏,可请求发射器重新发送数据。


校验和是使用某些函数通过信息数据计算的数据。它与信息数据一起通过噪声信道传输。在接收器端,使用收到的数据计算校验和。计算的校验和应匹配所收到的校验和。错误检测功能取决于冗余比特数量、数据大小,以及生成校验和所用的多项式。奇偶性、模块化和和与位置相关的校验和是几种可用于错误检测的校验和示例。在检测到错误的情况下,可通过信号通知发射器,重新传输数据。


某些校验函数不仅能够检测错误,还能指出数据中可能引入的某些类型的错误,从而在不重新发送数据的情况下让接收器能够获得正确的数据,这些函数被称为纠错码。能够被校正的错误也有限制。例如,汉明码是纠错码。尽管汉明码能够检测到双位错误,但只能校正数据中的单位错误。格雷码能够检测四位错误,但只能校正三位错误。BCH 码、Goppa码、Reed-Solomon码、Reed-Muller码和Hadamard码是以其发明人命名的其他代码。此类编码技术可作为信息和编码理论的一部分进行研究,是应用数学、电子工程和计算机科学的一个有趣和广泛的分支。


时间冗余是指以冗余的方式执行安全关键的任务,随时间而变化。由于这些冗余任务随时间而变化,因此有助于消除瞬时故障。其中,单个硬件信道上的时间冗余是使用同一款软件在一个硬件上执行多次安全关键的任务,然后再比较多次运算的结果。如果发现差异,则执行相关的纠正操作。上述“软件冗余”部分中描述的“软件多样化冗余”(一个硬件通道)是此类冗余的扩展版本。


并行硬件信道上的时间冗余是在并行信道上执行、但不同时执行所有安全关键的任务,它有助于随着时间的推移创建冗余。瞬时故障不会以相同的方式影响操作,即使并行信道是对称的硬件。上述“硬件冗余”部分中描述的“延迟锁步”是此类时间冗余的一个示例。


结语

汽车行业使用到多种设计技术,以实现安全性,各种冗余技术是实现安全性所必不可少的,目的是确保设备在发生故障时更加可靠和稳定。硬件冗余的优势是能够尽早检测到故障,但代价是需要增加硬件数量。另一方面,如果系统成本有限,那么软件冗余可能用处更大。总之,冗余是实现提高汽车安全性能的关键所在,可以利用硬件和软件冗余,以及信息冗余、时间冗余等,使得系统更加稳定而可靠。


作者:Deepak Negi、Neha Bagri和Vikas Agarwal

声明:本文内容及图片由BC-AUTO转载至网络。如涉及版权问题,请电联删除(400-606-5591)。




长按二维码识别关注我们


可靠性杂坛 本平台以推广可靠性相关知识为宗旨,内容涵盖可靠性基础知识、电子装联工艺可靠性、失效物理分析和故障预测与健康管理PHM等方面内容。文章以原创为主,打造精品可靠性专业交流园地。
评论
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 125浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 141浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 87浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 103浏览
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 113浏览
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 167浏览
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 80浏览
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 40浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 63浏览
  •     为控制片内设备并且查询其工作状态,MCU内部总是有一组特殊功能寄存器(SFR,Special Function Register)。    使用Eclipse环境调试MCU程序时,可以利用 Peripheral Registers Viewer来查看SFR。这个小工具是怎样知道某个型号的MCU有怎样的寄存器定义呢?它使用一种描述性的文本文件——SVD文件。这个文件存储在下面红色字体的路径下。    例:南京沁恒  &n
    电子知识打边炉 2025-01-04 20:04 98浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 66浏览
  • PLC组态方式主要有三种,每种都有其独特的特点和适用场景。下面来简单说说: 1. 硬件组态   定义:硬件组态指的是选择适合的PLC型号、I/O模块、通信模块等硬件组件,并按照实际需求进行连接和配置。    灵活性:这种方式允许用户根据项目需求自由搭配硬件组件,具有较高的灵活性。    成本:可能需要额外的硬件购买成本,适用于对系统性能和扩展性有较高要求的场合。 2. 软件组态   定义:软件组态主要是通过PLC
    丙丁先生 2025-01-06 09:23 83浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦