一种简单、实用的测量程序运行时间的方法

嵌入式大杂烩 2020-06-27 00:00

点击上方「嵌入式大杂烩」,选择「置顶公众号」第一时间查看嵌入式笔记!

前言

平时我们可能很少去关注程序运行的时间,但是在一些情况下可能需要对程序进行一个整体的复盘、优化。

那么,程序运行的时间就是一个可以考虑的方面,可以测一下某些代码块、函数、算法的运行时间,然后整体考虑看看有没有必要进行优化。

之前在某工控类项目中,我就有接到一个任务去测试程序中关键代码的执行时间,并输出报告。当时是使用一个GPIO+示波器进行测试的,也可以使用逻辑分析仪来测。

当时测量的方法很简单:

在要测试的代码块/函数之前设置该GPIO的电平为高电平,在要测试的代码块/函数之后设置该GPIO为低电平,使用示波器测高电平的时间,就知道了这一代码块/函数的运行时间。

下面就通过实例来介绍一下这种简单而有效的方法。

我这里使用逻辑分析仪来测量,使用小熊派开发板来验证,小熊派的主控为STM32L431RCT6,系统时钟设置为80MHz

这里顺带提一点题外话,之前有一些初学的读者朋友问我说逻辑分析仪贵不贵。逻辑分析仪有贵的也有便宜的,贵则上千上万元,便宜则有几十、几百。我觉得无论工作、还是学习,都有必要入手一个逻辑分析仪。


本篇笔记的测试用的逻辑分析仪就是某宝上二十几块钱买的,可以满足平时的学习所用。条件有限的学生朋友可以入手。有条件的可以考虑入手几百块钱的。

GPIO+逻辑分析仪测时间

1、测量HAL_Delay函数

STM32的HAL库有给我们提供一个HAL_Delay延时函数,这是一个ms级延时函数。这个延时函数依赖于系统滴答定时器,所以是一个比较精确的延时函数。

这里,我们就使用GPIO+逻辑分析仪的方法来测量一下这个延时函数。为了方便测试,我们在while死循环里进行测量。

代码:


测量结果:


可见,我们通过逻辑分析仪测出了HAL_Delay(100);运行的时间为100.4315ms,符合我们的预期。

这里高电平两侧其实就是低电平部分,只不过低电平持续的时间太短了,在这里看起来像一条竖线,我们放大来看看:


结果已经很准了,可以满足平时的测量。这种测量很难保证百分之百的精确,小数点后面的那一部分可能是受很多不可控因素的影响,这不在我们本篇文章的讨论范围之内。

我们是想通过这个示例来介绍这种测量方法的使用及证明这种方法是可行的。下面再继续看两个实例。

2、测量软件延时函数

我们以前刚开始学单片机的时候,经常有用到一些粗略的延时函数,其实现方法就是循环执行n条空语句,以达到一个延时的效果。

那么,我们怎么来构造一个us级或ms级的粗略延时函数(软件延时函数)。我们之前看到的粗略延时函数类似这样子:


这些函数里面需要给出一些循环的次数,这个值是怎么来确定的呢?比如上面这个函数中123这个值是怎么来确定的?我们可以使用GPIO+逻辑分析仪的方法来进行一个简单的确定。

确定1us:


不同的处理器,结果是不一样的。针对小熊派开发板(主控:STM32L431RCT6),循环运行15条空语句的时间实测结果是1.083us,这算是比较接近1us了。

我们就运用这个结果来构建一个us级软件延时函数如下:


接下来我们测一下soft_delay_us(100);实际运行了多长时间:


可见,结果差不多接近我们想要的结果。构建这样的粗略延时函数可以使用这样的方式来确定一些循环次数的值。

3、查表法VS常规法运行时间

在之前的文章:空间换时间,查表法的经典例子《空间换时间,查表法的经典例子》中,我们有说可以适当使用查表法降低程序的执行时间。这里我们来实际测量对比一下那篇文章中查表法与常规法的优劣。

关键代码:

/* 测试结果 */
struct test_res
{

 unsigned int data;  /* 数据          */
 unsigned int count; /* 数据中1的个数 */
};

/* ============常规法============ */
#if 1
struct test_res get_test_res(unsigned int data)
{
 /* 保存测试结果 */
 struct test_res res;
 
 /* 保证数据总会在0~0xf之间 */
 // unsigned int temp = data & 0xf;  
 unsigned int temp = data & 0xff;  
 
 res.count = 0;
 res.data = temp;
 
 /* 循环判断每一位 */
 for (int i = 0; i < 16; i++)
 {
  if (temp & 0x01)
  {
   res.count++;
  }
  temp >>= 1;
 }
 
 return res;
}
#else
/* ============查表法============ */

int table[16] = {0112122312232334};

struct test_res get_test_res(unsigned int data)
{
 /* 保存测试结果 */
 struct test_res res;
 
 /* 保证数据总会在0~0xf之间 */
 unsigned int temp = data & 0xff;  
 
 /* 获取低4位中1的个数 */
 unsigned int low_data = temp & 0xf;
 unsigned int low_cnt = table[low_data];
 
 /* 获取高4位中1的个数 */
 unsigned int high_data = (temp >> 4) & 0xf;
 unsigned int high_cnt = table[high_data];
 
 /* 结果 */
 res.count = low_cnt + high_cnt;
 res.data = temp;
 
 return res;
}

int main(void)
{
  /* USER CODE BEGIN 1 */
  struct test_res res = {0};
    
  /* 省略部分代码。。。。。。。。。 */
    
  while (1)
  {
  /* USER CODE END WHILE */
  /* USER CODE BEGIN 3 */
    HAL_GPIO_WritePin(GPIOA, GPIO_PIN_2, GPIO_PIN_SET);
    res = get_test_res(30);
    HAL_GPIO_WritePin(GPIOA, GPIO_PIN_2, GPIO_PIN_RESET);
  }
  /* USER CODE END 3 */
}
#endif


常规法程序的运行时间:


查表法程序的运行时间:


可见,这个例子中常规法程序运行时间约为2ns,而查表法程序运行时间约为500ns。查表法的程序运行之间仅为常规法的1/4,省下了3/4的时间。

随着调用次数的增多,这里的查表法的优势越大。比如循环计算0~31这32个数中每一个数二进制位为1的个数,则相关代码改为:

  int i;
  while (1)
  {
    HAL_GPIO_WritePin(GPIOA, GPIO_PIN_2, GPIO_PIN_SET);
    for (i = 0; i < 32; i++)
    {
      res = get_test_res(i);
    }
    HAL_GPIO_WritePin(GPIOA, GPIO_PIN_2, GPIO_PIN_RESET);
  }


常规法:


查表法:


可见,随着调用次数的增多,查表法相对于常规法更省时,即查表法的优势越大。

以上就是关于GPIO+逻辑分析仪测程序运行时间的几个实例。下面顺带提一下使用MDK+ST-LINK测STM32程序运行时间的方法。

MDK+ST-LINK测时间

在使用MDK作为开发工具时,可以搭配一些仿真器来查看程序执行时间。这里通过实例来介绍MDK+ST-LINK测STM32程序运行时间的方法。


这里重点是设置Trace里面的系统内核时钟,我们这里使用的是小熊派开发板(主控:STM32L431RCT6),并且配置的系统时钟是80MHz:


所以在Trace中要设置为80MHz。这个得根据实际芯片的型号就需要根据进行修改,比如STM32F103系列默认是72MHz,STM32F429系列默认为180MHz等,根据实际进行修改。

下面我们通过在线调试、打断点的方式看一下 HAL_Delay(1000);运行了多长时间:


可见程序运行到HAL_Delay(1000);前后的时间分别为:

前:0.00008964s
后:1.00108161s

HAL_Delay(1000);走过的时间约为1s,符合预期。

最后

以上就是本次的实践分享,感谢阅读与支持。如有错误,欢迎指出。谢谢!

若觉得文章不错,转发分享、在看,也是我们继续更新的动力。

在公众号内回复更多资源,可免费获取嵌入式资料。期待你的关注~

猜你喜欢

C语言、嵌入式应用:TCP通信实例分析

一些不可不知的计算机网络基础

AT指令测试ESP8266通信模组并获取天气数据

在SRAM、FLASH中调试代码的配置方法

STM32串口IAP分享



嵌入式大杂烩 专注于嵌入式技术,包括但不限于C/C++、嵌入式、物联网、Linux等编程学习笔记,同时,内包含大量的学习资源。欢迎关注,一同交流学习,共同进步!
评论
  • 当前,智能汽车产业迎来重大变局,随着人工智能、5G、大数据等新一代信息技术的迅猛发展,智能网联汽车正呈现强劲发展势头。11月26日,在2024紫光展锐全球合作伙伴大会汽车电子生态论坛上,紫光展锐与上汽海外出行联合发布搭载紫光展锐A7870的上汽海外MG量产车型,并发布A7710系列UWB数字钥匙解决方案平台,可应用于数字钥匙、活体检测、脚踢雷达、自动泊车等多种智能汽车场景。 联合发布量产车型,推动汽车智能化出海紫光展锐与上汽海外出行达成战略合作,联合发布搭载紫光展锐A7870的量产车型
    紫光展锐 2024-12-03 11:38 126浏览
  • 最近几年,新能源汽车愈发受到消费者的青睐,其销量也是一路走高。据中汽协公布的数据显示,2024年10月,新能源汽车产销分别完成146.3万辆和143万辆,同比分别增长48%和49.6%。而结合各家新能源车企所公布的销量数据来看,比亚迪再度夺得了销冠宝座,其10月新能源汽车销量达到了502657辆,同比增长66.53%。众所周知,比亚迪是新能源汽车领域的重要参与者,其一举一动向来为外界所关注。日前,比亚迪汽车旗下品牌方程豹汽车推出了新车方程豹豹8,该款车型一上市就迅速吸引了消费者的目光,成为SUV
    刘旷 2024-12-02 09:32 138浏览
  • 作为优秀工程师的你,已身经百战、阅板无数!请先醒醒,新的项目来了,这是一个既要、又要、还要的产品需求,ARM核心板中一个处理器怎么能实现这么丰富的外围接口?踌躇之际,你偶阅此文。于是,“潘多拉”的魔盒打开了!没错,USB资源就是你打开新世界得钥匙,它能做哪些扩展呢?1.1  USB扩网口通用ARM处理器大多带两路网口,如果项目中有多路网路接口的需求,一般会选择在主板外部加交换机/路由器。当然,出于成本考虑,也可以将Switch芯片集成到ARM核心板或底板上,如KSZ9897、
    万象奥科 2024-12-03 10:24 96浏览
  • 学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&
    youyeye 2024-11-30 14:30 85浏览
  •         温度传感器的精度受哪些因素影响,要先看所用的温度传感器输出哪种信号,不同信号输出的温度传感器影响精度的因素也不同。        现在常用的温度传感器输出信号有以下几种:电阻信号、电流信号、电压信号、数字信号等。以输出电阻信号的温度传感器为例,还细分为正温度系数温度传感器和负温度系数温度传感器,常用的铂电阻PT100/1000温度传感器就是正温度系数,就是说随着温度的升高,输出的电阻值会增大。对于输出
    锦正茂科技 2024-12-03 11:50 141浏览
  • 戴上XR眼镜去“追龙”是种什么体验?2024年11月30日,由上海自然博物馆(上海科技馆分馆)与三湘印象联合出品、三湘印象旗下观印象艺术发展有限公司(下简称“观印象”)承制的《又见恐龙》XR嘉年华在上海自然博物馆重磅开幕。该体验项目将于12月1日正式对公众开放,持续至2025年3月30日。双向奔赴,恐龙IP撞上元宇宙不久前,上海市经济和信息化委员会等部门联合印发了《上海市超高清视听产业发展行动方案》,特别提到“支持博物馆、主题乐园等场所推动超高清视听技术应用,丰富线下文旅消费体验”。作为上海自然
    电子与消费 2024-11-30 22:03 107浏览
  • TOF多区传感器: ND06   ND06是一款微型多区高集成度ToF测距传感器,其支持24个区域(6 x 4)同步测距,测距范围远达5m,具有测距范围广、精度高、测距稳定等特点。适用于投影仪的无感自动对焦和梯形校正、AIoT、手势识别、智能面板和智能灯具等多种场景。                 如果用ND06进行手势识别,只需要经过三个步骤: 第一步&
    esad0 2024-12-04 11:20 103浏览
  • 光伏逆变器是一种高效的能量转换设备,它能够将光伏太阳能板(PV)产生的不稳定的直流电压转换成与市电频率同步的交流电。这种转换后的电能不仅可以回馈至商用输电网络,还能供独立电网系统使用。光伏逆变器在商业光伏储能电站和家庭独立储能系统等应用领域中得到了广泛的应用。光耦合器,以其高速信号传输、出色的共模抑制比以及单向信号传输和光电隔离的特性,在光伏逆变器中扮演着至关重要的角色。它确保了系统的安全隔离、干扰的有效隔离以及通信信号的精准传输。光耦合器的使用不仅提高了系统的稳定性和安全性,而且由于其低功耗的
    晶台光耦 2024-12-02 10:40 143浏览
  • 11-29学习笔记11-29学习笔记习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-02 23:58 92浏览
  • 《高速PCB设计经验规则应用实践》+PCB绘制学习与验证读书首先看目录,我感兴趣的是这一节;作者在书中列举了一条经典规则,然后进行详细分析,通过公式推导图表列举说明了传统的这一规则是受到电容加工特点影响的,在使用了MLCC陶瓷电容后这一条规则已经不再实用了。图书还列举了高速PCB设计需要的专业工具和仿真软件,当然由于篇幅所限,只是介绍了一点点设计步骤;我最感兴趣的部分还是元件布局的经验规则,在这里列举如下:在这里,演示一下,我根据书本知识进行电机驱动的布局:这也算知行合一吧。对于布局书中有一句:
    wuyu2009 2024-11-30 20:30 142浏览
  • 遇到部分串口工具不支持1500000波特率,这时候就需要进行修改,本文以触觉智能RK3562开发板修改系统波特率为115200为例,介绍瑞芯微方案主板Linux修改系统串口波特率教程。温馨提示:瑞芯微方案主板/开发板串口波特率只支持115200或1500000。修改Loader打印波特率查看对应芯片的MINIALL.ini确定要修改的bin文件#查看对应芯片的MINIALL.ini cat rkbin/RKBOOT/RK3562MINIALL.ini修改uart baudrate参数修改以下目
    Industio_触觉智能 2024-12-03 11:28 110浏览
  • RDDI-DAP错误通常与调试接口相关,特别是在使用CMSIS-DAP协议进行嵌入式系统开发时。以下是一些可能的原因和解决方法: 1. 硬件连接问题:     检查调试器(如ST-Link)与目标板之间的连接是否牢固。     确保所有必要的引脚都已正确连接,没有松动或短路。 2. 电源问题:     确保目标板和调试器都有足够的电源供应。     检查电源电压是否符合目标板的规格要求。 3. 固件问题: &n
    丙丁先生 2024-12-01 17:37 114浏览
  • 概述 说明(三)探讨的是比较器一般带有滞回(Hysteresis)功能,为了解决输入信号转换速率不够的问题。前文还提到,即便使能滞回(Hysteresis)功能,还是无法解决SiPM读出测试系统需要解决的问题。本文在说明(三)的基础上,继续探讨为SiPM读出测试系统寻求合适的模拟脉冲检出方案。前四代SiPM使用的高速比较器指标缺陷 由于前端模拟信号属于典型的指数脉冲,所以下降沿转换速率(Slew Rate)过慢,导致比较器检出出现不必要的问题。尽管比较器可以使能滞回(Hysteresis)模块功
    coyoo 2024-12-03 12:20 170浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦