对付偶发性问题的基本策略是:
(1)通过问题现象,初步判断问题的出现点。
(2)用多种手段,锁定问题现场。
(3)用验证的方法放大问题点,使之由偶发性问题变为必发问题。
(4)根据问题出现机理,提出解决对策
(5)验证解决对策的可靠性。
下面详细介绍三种具体的方法来锁定偶发性问题:
(1) 如果对实时性不高,那么可以采用文件、串口等记录手段记录程序运行过程中的各个状态、关键变量的编号,便于发生问题后跟踪分析。
(2) 如果实时性要求很高,定义若干个公共数组变量,用于记录在程序运行过程中各关键变量和现场数据,增加条件停止的程序,即所谓的陷阱程序。当发生问题后,程序跑到陷阱程序中 可以通过停止运行或把公共变量通过串口、屏幕输出,观察分析问题原因。
(3) ARM嵌入式系统中,如果程序出现突然复位或者死机时,如何找回现场?很简单,只需要在启动点上再设一个断点,当程序复位或死机时,并停止运行时,观察R13,然后 在内存中找到R13所指的程序段,反汇编之(AXD可以反汇编内存),就可以大概分析出哪个函数出问题。然后追溯到对应的C代码上,在该C代码之前若干行设置断点,然后单步运行,可以观察到问题再现。
(4) 用多余的I/O口来跟踪程序的运行状态,方法是:当程序运行到某程序段时某输出口为高电平,否则为低电平。用示波器观察输出口状态,如果问题出现在高电平,则可以初步判定可能该段程序有问题,可以深入跟踪之。这在前后台系统中比较管用,在多任务系统中, 可以考虑用多引脚组合起来跟踪。这种方法对于实时测量系统中跟踪程序很好用。