嵌入式软件调试偶发性问题技巧

嵌入式ARM 2023-11-02 17:14
经常有朋友问我,该如何调试程序的偶发性问题?

大家所谓的偶发性问题,就是很难复现、较难定位的问题,比如在家里验证了N遍,固件一发布到客户现场就各种宕机;现场刚调试得明明白白,正准备离开客户公司大门,客户来电话了,然而折返复现问题,却死活不出现;明明有些代码“对天发誓”不会存在问题,而程序运行久了总有概率在那一块翻车,等等。

确实遇到这样的问题属实让人头皮发麻,比如你在深圳,客户现场在北京,出了一些偶发性问题,很多朋友心里想要是能飞过去插个仿真器那这些bug不是分分钟的事情吗?其实也不是不可能,远程仿真工具嘛~最怕客户现场没有网络~

不过问题是有些bug不是随随便便给你面子复现的,甚至它隔个好几天问候一下你,总不能可能一直干等吧。

那么,对于这样的偶发性问题,我们到底该如何解决呢?

1

知己知彼

首先我们要充分的了解和把握出现问题的情景,比如问题出现时,是否客户做了什么操作、是否有停过电、大概在几点出现的、是否存在一定的规律、如果现场有多台机器,他们是否都会出现类似的问题等等。
只有充分了解了问题现场的详细发生情景,你才能快速的排除一些问题、缩小定位的范围,最重要的是分清楚到底是软件问题,还是硬件问题?
我见过很多老实巴交的软件朋友一遇到问题就打开工程查软件bug,那只会让我觉得你头是有原因的。
同时也要对所收集的信息进行一些筛选和排除,因为一个现象对于不同的人会有不同的描述,有些客户并不是专业人士一些现象描述得不清楚,有可能把你带入误区。

所以结合系统日志信息、目前设备状态和售后或者客户描述,进行初步的问题定位。

2

不能全靠猜

很多朋友了解了具体的问题以后就抱着猜一猜的心态,凭感觉去修改代码,如果问题不再出现就认为是修护了该问题,这样的做法是不科学的。
作为一名工程师还是要本着务实求真的态度,一步一步的缩小问题的范围,通过安插测试程序来检测难以复现的偶发性问题,让工程师来主动查找bug,还不如安插一些bug捕捉程序来自动监测bug,这样也会更加的精准。
多模拟一些问题出现频率较高的环境和状态,比如有一个问题专门在晚上发生,那么我们可以构建一个晚上的环境,比如系统时钟的调整、系统访问用户的增加或者晚上的一些特殊操作等等。

从而进一步降低复现问题的成本。

3

没有仿真器怎么办? 

很多朋友已经习惯了用仿真器来进行问题的排查,确实仿真器几乎暴露了系统运行的所有状态,再加上一些条件断点、查看工具等的加持,bug基本上跑不了。
在产品开发的前期阶段,这样的开发和解决问题方式是高效的,但这样的愿景在真正的产品上线以后是比较难实现的,比如一些防水密封或者大型的设备等。
所以,还是要借助一些其他手段帮助我们分析问题,依靠一些通信协议把相应的数据传输出来进行分析。
打印日志信息是大家经常想到的,也是一种老牌调试办法了~对于大部分对时间要求不敏感的问题是最合适的调试手段了;如果是离线运行的话,可以找一片存储区,比如Flash或者SD等,或者自带文件系统的可以直接写到文件中,以便后续拷贝或者上传出来进行分析。
然而日志打印比较耗时,对于很多偶发性问题,可能就是一闪而过的事情,而且最可怕的莫过于你的日志打印里面也有bug,所以寻找一个越简单越好。
直接通过构造问题出现的判断条件,然后赋予不同的调试变量不同的标识,当问题出现以后进入并保存相应的信息到调试变量中,最终接上上位机就可以看到,简单直接。

然而,有些降成本的产品连个通信都没有,那该怎么玩呢?Led、IO口你值得拥有,他们都可以通过高低电平的状态来传递信息给外界,如果你够狠的话,还可以自己定义一套单总线通信协议。

4

直接Game Over 

当然还有一种是直接死机了,这种问题是比较头疼的,如果只是像hardfault这样的可循异常,倒可以在死机前进行现场环境保存工作。
同样对于直接复位的情况,大家也可以在程序入口地址处通过打印相关的信息来供分析,比如寄存器的值等内存信息,来回溯到之前的复位点。
但是,对于程序既不运行也不复位的情况,就没那么好处理了,很多人会想到实时的记录一些变量和可疑条件等等,也未尝不是一种办法把,大概率还是会漏检。
不过,这种情况下大概率还是跟硬件脱不了干系,务必先排查电源电压、功率等干扰问题,再考虑采用屏蔽二分法进行排查代码~
好了,基本上调试偶发性bug就这么多分享了,希望这篇文章能对大家有所帮助。

END

来源:最后一个bug


版权归原作者所有,如有侵权,请联系删除。


推荐阅读

我用这个技术,干掉几千行if else!

麒麟9000s,并非来自SMIC,而是...

程序员最容易读错的单词,听到status我炸了


→点关注,不迷路←

嵌入式ARM 关注这个时代最火的嵌入式ARM,你想知道的都在这里。
评论
  • 在当今数字化时代,嵌入式系统无处不在,从我们手中的智能手机、智能手表,到汽车中的电子控制系统、工业自动化设备,嵌入式开发技术的发展历程宛如一部波澜壮阔的科技史诗,深刻地改变了我们的生活和社会的运作方式。萌芽阶段(20 世纪 60 - 70 年代)嵌入式开发的起源可以追溯到 20 世纪 60 年代。当时,计算机技术刚刚兴起,体积庞大且价格昂贵。为了满足特定设备的控制需求,工程师们开始尝试将计算机技术应用于一些专用系统中。这一时期,嵌入式系统的概念逐渐萌芽。1965 年,美国数字设备公司(DEC)推
    Jeffreyzhang123 2024-12-31 10:08 107浏览
  • 高精度,抗干扰,设计灵活……一句话总结:打铁还需自身硬!2040年,人形机器人的数量或将超过人类,达到100亿个。 10月29日,沙特投资倡议论坛,在谈及AI和人形机器人赛道时,马斯克再一次大胆预测,描绘出上述令人震撼的未来景象,且预估每台机器人的价格将稳定在2万-2.5万美元之间。当下,技术飞速发展,众多机器人公司如雨后春笋般涌现。余建华,艾迈斯欧司朗资深应用工程师,深感对这个市场的期待,他表示每一个机器人关节的背后,都离不开位置传感器的精准掌控。这片市场的潜力,让人憧憬不已。在工业及消费中
    艾迈斯欧司朗 2024-12-30 17:25 52浏览
  •         在之前的文章中,我们介绍了IEEE 802.3cz[1]协议,MultiGABSE-AU物理层中XMII、PCS子层以及两个可选功能的相关内容,本篇将介绍MultiGABSE-AU物理层PMA子层及PMD子层的相关机制。PMA子层        PMA子层位于PCS子层和PMD子层之间,规范中定义了PMA子层的三个功能:PMA Transmit、PMA Receive及PHY Control。&nbs
    经纬恒润 2024-12-30 18:16 96浏览
  • 产品概述MG600Q2YMS3 是一款基于硅基碳化物(SiC)技术的高功率N沟道MOSFET模块,适用于高功率开关和电机控制应用,如轨道牵引系统。其设计旨在满足高效能和快速切换需求,为工业和能源领域提供可靠解决方案。主要特性1. 高电压和电流能力   耐压 (VDSS):1200 V   漏极电流 (ID):600 A2. 高效率与低损耗   碳化硅材料降低导通损耗和开关损耗,实现更高的转换效率。3. 快速切换性能 支持高频操作,适用于
    东芝铠侠代理 2024-12-31 10:33 65浏览
  • “新时代,共享未来”2024年11月5日-10日,第七届中国国际进口博览会在上海圆满落幕。其中,3万平方米的汽车展区展览面积,也让观众笑谈进博会再次进入“车展”时间。全球15大整车品牌,40多家企业参展,其中不乏耳熟能详,七届进博会“全勤生”的国际知名OEM,也会有首次参加的“新面孔”,它们共同构成了今年汽车展区的“全家福”。近年来,中国汽车进口均超百万辆。因此,对跨国车企来说,中国市场的重要性不言而喻。同时,在电动化和智能化赛道中弯道超车的中国汽车市场,也是全球汽车行业竞争最为激烈的市场,在这
    艾迈斯欧司朗 2024-12-30 17:05 50浏览
  • 近日,紫光展锐正式推出高性能4G 智能穿戴平台W377E。该产品面向不同的应用场景,拥有丰富特性和超低功耗,进一步壮大紫光展锐的智能穿戴产品组合。紫光展锐面向中高端和海量的智能穿戴市场,持续提供技术先进、高效安全、高质可靠的解决方案。 紫光展锐W377E采用四核A53架构,支持13M摄像头,video 1080P 30fps,集成了Wi-Fi、蓝牙和GPS功能。W377E搭载Android 8.1系统,提供更加丰富多样的APP体验,支持在线好友聊天、支付宝等功能,且支持64位系统的AP
    紫光展锐 2024-12-31 16:26 104浏览
  • 全球领先的光学解决方案供应商艾迈斯欧司朗(瑞士证券交易所股票代码:AMS)近日宣布,于2024年6月26-28日携汽车智能照明和智能座舱解决方案及相关产品和技术,亮相位于昆山市花桥国际博览中心的第十九届汽车灯具产业发展技术论坛暨上海国际汽车灯具展览会(以下简称:ALE),展示艾迈斯欧司朗优质的光发射器、光学元件、微型模组、传感器等产品在汽车领域的创新应用,展位号B馆T202。乘着车灯产业盛会的东风,全国汽车标准化技术委员会灯具及灯光分技术委员会秘书长卜伟理, 蔚来汽车内外车灯团队专家及电气工程副
    艾迈斯欧司朗 2024-12-30 16:55 63浏览
  • 感光百科:4000万片出货量背后的“技术经”目前,仅单点dToF,艾迈斯欧司朗的累积出货量就已超过了4000万片。大量采用的背后必然代表无数用户对这一技术的认可和信赖。究竟是什么魔力,让dToF传感器拥有如此强大的吸引力?又是怎样的know-how积累让艾迈斯欧司朗的dToF产品如此受到青睐?让我们再次回到底层原理来探究dToF 4000万片出货量背后的“技术经”。01、底层原理决定应用上限dToF传感器,顾名思义,直接飞行时间测量,基于光速不变,测量光子从发射端到接收端的光程差,从而直接计算二
    艾迈斯欧司朗 2024-12-30 18:21 82浏览
  • 时源芯微EMC(电磁兼容)领域,充斥着众多专业术语,令人眼花缭乱。1 电磁兼容(EMC)定义:指电气装置或系统在共同的电磁环境条件下,既能保持正常功能,又不会对周围环境产生不良影响。2  电磁环境Electromagnetic Environment定义:指存在于某一特定场所的所有电磁现象的总和。3半电波暗室Semi-anechoic Chamber定义:一种屏蔽室,除地面安装反射接地平板外,其余内表面均覆盖有吸波材料。4 远场Far Field定义:在天线辐射的场域中,功率密度与距离
    时源芯微 2024-12-31 10:52 98浏览
  • 本文介绍Linux系统查看硬件配置及常用调试命令,方便开发者快速了解开发板硬件信息及进行相关调试。触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。查看DDR获取内存信息下面数字以MB为单位。root@ido:/# free -mtotalused free shared buff/cache availableMem:
    Industio_触觉智能 2024-12-31 10:01 63浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球CAN-Bus总线电缆产值达到2287百万美元,2024-2030年期间年复合增长率CAGR为3.6%。一、行业概述CAN-Bus总线电缆是一种专门用于CAN总线(Controller Area Network,控制器局域网络)通信系统中的电缆。CAN总线是一种广泛应用于汽车、工业自动化、机器人等领域的串行通信协议,主要用于微控制器和设备之间的数据交换。CAN-Bus电缆负责在多个设备间传输数据,保证信息的稳定传输和
    GIRtina 2024-12-31 11:00 93浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦