揭秘难以复现Bug的解决之道:堆栈分析实战

原创 typedef 2024-09-01 18:30

目录

  • 引言
    • 友情提示
    • 难以复现的Bug之痛
  • 寄存器(SP、LR)详解
    • SP寄存器:堆栈的指路明灯
    • LR寄存器:函数调用与异常处理的桥梁
  • 问题分析与解决流程揭秘
    • 保存现场
    • 分析堆栈数据
         ○ 堆栈结构
         ○ 入栈顺序
  • 案例
    • J-Link工具
         ○ 常用命令
         ○ 保存RAM数据到本地
    • 分析栈基本信息
         ○ 分析栈结构
         ○ 分析入栈顺序
    • 分析栈数据
  • 结语

引言

友情提示

本文接近三千字,预计阅读时间为10-15分钟。建议您在空闲时细细阅读,享受阅读的乐趣。

难以复现的Bug之痛

你是否曾为那些难以复现的Bug而头疼不已?本文将揭秘一种通过堆栈分析来定位并解决这类问题的神奇方法。

作为一名开发人员,在开发过程中会碰到各式各样的问题,如果能通过一些操作复现问题的,通过对目标板进行调试还能够逐步分析。

但是,如果由于某些原因不能对目标板进行调试,这种情况分析可就比较复杂了。

这不,前一阵子就碰到了一个问题,在调试过程中,怎样都无法复现问题。直到后来才发现一个现象,只有在对目标板上电时才有一定几率复现问题,即频繁的对目标板进行断电-上电测试。

降臣:“你难道不好奇你的功力是从何而来嘛?”
李星云:“不好奇”
降臣:“你难道不好奇为何换心之后 无法压制这突增的内力吗?”
李星云:“不好奇”
降臣:“你难道不好奇为何你只能活半年?”
李星云:“不好奇”
降臣:“你好奇”
李星云:“不好奇”
降臣:“你好奇”
李星云:“不好奇”

如何对这种问题进行分析,你难道不好奇嘛?

寄存器(SP、LR)详解

这里介绍两个寄存器。SP(Stack Pointer)寄存器和LR(Link Register)寄存器是非常重要的寄存器。

SP寄存器:堆栈的指路明灯

SP寄存器用于指向当前堆栈的栈顶位置。在函数调用时,SP寄存器会调整以反映堆栈的变化,确保数据正确地存储和取出。

LR寄存器:函数调用与异常处理的桥梁

LR寄存器有两个作用。

  1. 函数调用:当一个函数调用另一个函数时,LR寄存器保存当前函数的返回地址。
  2. 异常处理:当发生异常时,LR寄存器保存异常处理程序的返回地址。

问题分析与解决流程揭秘

保存现场

在处理难以复现的Bug时,保存现场数据是至关重要的一步。这就像是在犯罪现场拍照留证一样,能够为我们后续的分析提供宝贵的线索。

当上电出现死机问题后,插上Jlink,使用J-Link commander软件连接目标板,然后通过命令将芯片RAM中的区域保存成二进制文件存放到电脑本地。

如果应用程序的版本号不确定,也可以将ROM中的程序保存到本地,操作方法同保存RAM,后面会说到如何保存。

接下来,我们会分析RAM中的数据。

幸运的情况下,可以直接找到最后一次被调用的函数,然后分析某个函数的功能,即可找到问题。而有的情况下就可能还需要根据函数的前后调用关系分析出问题所在。

分析堆栈数据

我之前也不知道如何分析堆栈数据,第一次分析的时候就感觉进了一个迷宫,绕着绕着就把自己绕进去了。

你可以想象一下,拿着一份二进制文件,去分析函数的调用关系,想想就脑壳疼...

分析堆栈时需要知道下面几个知识点,才能正确分析,我接下来会解释一下。

堆栈结构

堆栈结构主要有四种类型,分别是满递减堆栈、满递增堆栈、空递减堆栈和空递增堆栈。

递增/递减是指栈向高地址还是低地址增长,满是指栈指针(SP)总是指向堆栈中的最后一个元素,即最后压入的数据。空是指栈指针(SP)总是指向下一个将要放入数据的空位置。

常用的可能还是满递减堆栈比较多一点。

入栈顺序

因为我们要分析栈中的数据,所以我们通过汇编查看依次有哪些数据入栈,然后分析出当前的LR寄存器中的值。例如下方是一个入栈的汇编指令。我们需要知道入栈的顺序,是从右往左入栈的还是从左往右入栈的。

0x08000644 B570      PUSH     {r4-r6,lr}

案例

J-Link Commande工具

首先需要安装J-Link软件,去官网https://www.segger.com/downloads/jlink/下载,这里是一个套件,安装后会有若干个独立的小软件。

我们需要使用的是J-Link Commande软件。打开软件之后,可以输入?来查看支持的命令,如下图:

感兴趣的可以研究这些命令,会对自己有所帮助的。

分析栈基本信息

这里需要分析的是栈属于上面说的四种结构的哪一种,以及数据入栈的顺序是如何的。

这里我们需要将ARM仿真器连接目标板进行调试,通过单步调试定位到PUSH汇编指令中,如下图所示:

当未执行 0x08000E0C B510 PUSH {r4,1r} 入栈操作时,当前的栈指针SP指向0x20000658地址,并且该地址中值不为空。从而说明当前的SP指向的是最后一个入栈的元素,即可判定为堆栈。

随后我们单步执行,让其执行入栈操作,再来看堆栈中的数据,如下图所示:

此时我们看到SP的地址为0x20000650,执行了入栈操作,SP的地址减小了,从而判定堆栈的生长方向是递减的。根据上述两个判断从而能得出堆栈结构为满递减堆栈

接下来我们要判断数据入栈的顺序,这个汇编是将r4以及lr寄存器中的值入栈。分析入栈后的数据得知,第一个入栈的数据为0x08000DE1,刚好是lr寄存器中的值。我在图片中也标注了入栈数据对应的寄存器。从而可以得出结论,入栈的顺序是从右往左的,先入栈lr后入栈r4

保存RAM数据到本地

需要执行如下几个步骤,即可连接到目标板。

  1. 当系统死机后,需要将目标板连接到ARM仿真器。
  2. 使用管理员的身份打开J-Link Commande工具(否则后面保存数据会提示写入文件失败)
  • connect命令准备连接目标板
  • 选择目标芯片型号
  • 选择调试接口
    • JTAG
    • SWD
    • cJTAG
  • 选择接口速度
  • 连接成功提示
  1. SaveBin命令保存栈数据
  • SaveBin c:/ram.bin 0x20000000 0x5000
  • 我这里是将整个RAM区域的数据保存起来了

这里用到了一个SaveBin的命令,命令的原型如下:

SaveBin  SaveBin , ,   Save target memory range into binary file.

如下图所示,是我连接目标板到保存RAM数据的所有操作,此时C盘根目录就会出现一个ram.bin的文件。

分析栈数据

当我们使用jlink连接目标板后,输入命令h可以看到一些关键信息,如下图:

可以看到SP(R13)= 20000654, PC = 08000E1E, IPSR = 000 (NoException),那我们先去看pc指向的地址是属于哪一个函数的。我们可以直接在汇编窗口中输入地址然后直接跳转过去,如下图所示:

通过定位得知,这个地址是在InitC函数内,如下图:

而且这个函数刚执行的时候,执行了一次PUSH操作入栈了三个元素,根据之前的分析,入栈的顺序是从右往左,所以第一个入栈的数据就是LR,又因为当前的SP指针指向的地址为20000654,然后去查ram.bin数据,如下图:

从而可以推断出LR的值为0x08000E13,这里是PC+1的值,所以函数返回的实际地址为0x08000E12。然后再在跳转到这个地址,根据上面图片,发现是一个出栈三个元素的指令,同样找到LR实际地址0x08000E02然后在跳转到这个地址,反发仍然是一个出栈三个元素的出栈指令,同样找到LR实际地址为0x08001046,再继续跳转到这个地址,发现是一个延时函数了如下图:

至此,就是通过分析栈数据分析函数的调用关系,这里写了一个简单的测试历程,通过按下按键会执行几层函数调用最后进入一个死循环,从而模拟死机的情况。

怎么样,看着是不是感觉特简单,但是在实际的开发过程中,真实情况可能比这复杂百倍。

结语

为了写这篇文章真的下了血本,我买了一个STM32的小开发板以及一个ARM仿真器,这对于原本就不富裕的我来说无疑是雪上加霜。

感谢您的耐心阅读!如果您觉得本文有帮助,请不要吝啬您的点赞、分享和收藏!

END

点赞、转发加关注,一键三连,好运年年

关注公众号后台回复数字688或668可获取嵌入式相关资料

往期推荐

加个变量,程序崩了

关于海明码,我悟了

为什么C语言执行效率高,运行快?

工作这么久,才明白的SOLID设计原则

typedef 主要用于记录个人学习、总结、分享的一个平台。 教学相长,共同进步。同时并建立技术交流群,欢迎加入。期待您的关注。
评论
  • PLC组态方式主要有三种,每种都有其独特的特点和适用场景。下面来简单说说: 1. 硬件组态   定义:硬件组态指的是选择适合的PLC型号、I/O模块、通信模块等硬件组件,并按照实际需求进行连接和配置。    灵活性:这种方式允许用户根据项目需求自由搭配硬件组件,具有较高的灵活性。    成本:可能需要额外的硬件购买成本,适用于对系统性能和扩展性有较高要求的场合。 2. 软件组态   定义:软件组态主要是通过PLC
    丙丁先生 2025-01-06 09:23 71浏览
  • 随着市场需求不断的变化,各行各业对CPU的要求越来越高,特别是近几年流行的 AIOT,为了有更好的用户体验,CPU的算力就要求更高了。今天为大家推荐由米尔基于瑞芯微RK3576处理器推出的MYC-LR3576核心板及开发板。关于RK3576处理器国产CPU,是这些年的骄傲,华为手机全国产化,国人一片呼声,再也不用卡脖子了。RK3576处理器,就是一款由国产是厂商瑞芯微,今年第二季推出的全新通用型的高性能SOC芯片,这款CPU到底有多么的高性能,下面看看它的几个特性:8核心6 TOPS超强算力双千
    米尔电子嵌入式 2025-01-03 17:04 48浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 72浏览
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 76浏览
  • 物联网(IoT)的快速发展彻底改变了从智能家居到工业自动化等各个行业。由于物联网系统需要高效、可靠且紧凑的组件来处理众多传感器、执行器和通信设备,国产固态继电器(SSR)已成为满足中国这些需求的关键解决方案。本文探讨了国产SSR如何满足物联网应用的需求,重点介绍了它们的优势、技术能力以及在现实场景中的应用。了解物联网中的固态继电器固态继电器是一种电子开关设备,它使用半导体而不是机械触点来控制负载。与传统的机械继电器不同,固态继电器具有以下优势:快速切换:确保精确快速的响应,这对于实时物联网系统至
    克里雅半导体科技 2025-01-03 16:11 176浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 90浏览
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 110浏览
  •     为控制片内设备并且查询其工作状态,MCU内部总是有一组特殊功能寄存器(SFR,Special Function Register)。    使用Eclipse环境调试MCU程序时,可以利用 Peripheral Registers Viewer来查看SFR。这个小工具是怎样知道某个型号的MCU有怎样的寄存器定义呢?它使用一种描述性的文本文件——SVD文件。这个文件存储在下面红色字体的路径下。    例:南京沁恒  &n
    电子知识打边炉 2025-01-04 20:04 79浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 87浏览
  • 光耦合器,也称为光隔离器,是一种利用光在两个隔离电路之间传输电信号的组件。在医疗领域,确保患者安全和设备可靠性至关重要。在众多有助于医疗设备安全性和效率的组件中,光耦合器起着至关重要的作用。这些紧凑型设备经常被忽视,但对于隔离高压和防止敏感医疗设备中的电气危害却是必不可少的。本文深入探讨了光耦合器的功能、其在医疗应用中的重要性以及其实际使用示例。什么是光耦合器?它通常由以下部分组成:LED(发光二极管):将电信号转换为光。光电探测器(例如光电晶体管):检测光并将其转换回电信号。这种布置确保输入和
    腾恩科技-彭工 2025-01-03 16:27 171浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 94浏览
  • 自动化已成为现代制造业的基石,而驱动隔离器作为关键组件,在提升效率、精度和可靠性方面起到了不可或缺的作用。随着工业技术不断革新,驱动隔离器正助力自动化生产设备适应新兴趋势,并推动行业未来的发展。本文将探讨自动化的核心趋势及驱动隔离器在其中的重要角色。自动化领域的新兴趋势智能工厂的崛起智能工厂已成为自动化生产的新标杆。通过结合物联网(IoT)、人工智能(AI)和机器学习(ML),智能工厂实现了实时监控和动态决策。驱动隔离器在其中至关重要,它确保了传感器、执行器和控制单元之间的信号完整性,同时提供高
    腾恩科技-彭工 2025-01-03 16:28 166浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦