一个线程内存泄漏问题定位过程

一口Linux 2021-09-16 11:50

推荐关注👇下方公众号学习更多Linux、驱动知识!


记录一个关于线程内存泄漏问题的定位过程,以及过程中的收获。

1. 初步定位

是否存在内存泄漏:想到内存泄漏,首先查看/proc/meminfo,通过/proc/meminfo可以看出总体内存在下降。确定内存泄漏确实存在。top中可以显示多种形式内存,进而可以判断是那种泄漏。比如vss/rss/pss等。

确定哪个进程内存泄漏:通过top即可查看到是哪个进程在泄漏。至此基本可以确定到哪个进程。

确定进程泄漏内存类型:然后查看进程的/proc/<pid>/maps,通过maps可以看出泄漏的内存类型(堆、栈、匿名内存等等),有时候运气好可以直接判断泄漏点。

如果是slab:可以通过/proc/slabinfo,可以看出进程的动态变化情况。如果确定是哪一个slab,那么可以在/sys/kernel/slab/<slab name>/alloc_calls和free_calls中直接找到调用点。当然看到的是内核空间的函数。

使用mcheck():可以检查malloc/free造成的泄漏问题,详细参考《2.
mtrace/muntrace/MALLOC_TRACE(重复释放、泄漏)》

通过如下脚本,然后对每次抓取内容进行Beyond Compare。每个一定周期抓取相关内存消耗信息。

#!/bin/bash
echo > mem_log.txt
while true
do
cat /proc/meminfo >>mem_log.txt
cat /proc/<pid>/maps >>mem_log.txt
cat /proc/slabinfo >>mem_log.txt
sleep 240
done

当然还有其他工具gcc Sanitier、Valgrind等等,由于嵌入式环境受限未能使用。

2. 深入定位

同步查看meminfo、maps、slabinfo,发觉进程虚拟内存损耗很快,远比系统MemFree损耗快。而且slabinfo没有和maps同步损耗。

所以问题重点检查maps问题。

00010000-00083000 r-xp 00000000 b3:11 22         /heop/package/AiApp/AiApp
00092000-00099000 rwxp 00072000 b3:11 22 /heop/package/AiApp/AiApp
00099000-00b25000 rwxp 00000000 00:00 0 [heap]
00b51000-00b52000 ---p 00000000 00:00 0
00b52000-01351000 rwxp 00000000 00:00 0 [stack:30451]
01351000-01352000 ---p 00000000 00:00 0
01352000-01b51000 rwxp 00000000 00:00 0
01b51000-01b52000 ---p 00000000 00:00 0
01b52000-02351000 rwxp 00000000 00:00 0 [stack:30432]
02351000-02352000 ---p 00000000 00:00 0
02352000-02b51000 rwxp 00000000 00:00 0
02b51000-02b52000 ---p 00000000 00:00 0
...
64f55000-65754000 rwxp 00000000 00:00 0 [stack:28646]
65754000-65755000 ---p 00000000 00:00 0
65755000-65f54000 rwxp 00000000 00:00 0 [stack:28645]
65f54000-65f55000 ---p 00000000 00:00 0
65f55000-66754000 rwxp 00000000 00:00 0 [stack:28642]
66754000-6675a000 r-xp 00000000 00:02 5000324 /usr/lib/AiApp/gstreamer-1.0/libgsticcsink.so
6675a000-66769000 ---p 00000000 00:00 0
...
6699f000-669a0000 rwxp 00000000 00:02 4999516 /usr/lib/AiApp/gstreamer-1.0/libgstapp.so
669a0000-66a2e000 rwxp 00000000 00:02 4999517 /usr/lib/AiApp/gstreamer-1.0/libgstlive555src.so
66a2e000-66a3e000 ---p 00000000 00:00 0
66a3e000-66a44000 rwxp 0008e000 00:02 4999517 /usr/lib/AiApp/gstreamer-1.0/libgstlive555src.so
66a44000-66a45000 rwxp 00000000 00:00 0
66a45000-66a46000 ---p 00000000 00:00 0
66a46000-67245000 rwxp 00000000 00:00 0 [stack:28631]
67245000-67246000 ---p 00000000 00:00 0
67246000-67a45000 rwxp 00000000 00:00 0 [stack:28630]
...
6b245000-6b246000 ---p 00000000 00:00 0
6b246000-6ba45000 rwxp 00000000 00:00 0 [stack:28613]
6ba45000-6ba46000 ---p 00000000 00:00 0
6ba46000-6c245000 rwxp 00000000 00:00 0 [stack:28610]
6c245000-71066000 rwxs 00000000 00:01 196614 /SYSV5553fc99 (deleted)
71066000-71067000 ---p 00000000 00:00 0
71067000-71866000 rwxp 00000000 00:00 0 [stack:28609]
71866000-71867000 ---p 00000000 00:00 0
71867000-72066000 rwxp 00000000 00:00 0 [stack:28608]
72066000-72228000 rwxs e3dc4000 00:02 6918 /dev/mmz_userdev
72228000-725ac000 rwxs e3a40000 00:02 6918 /dev/mmz_userdev
725ac000-75cac000 rwxs 00000000 00:01 131076 /SYSV6702121c (deleted)
75cac000-75e8a000 rwxs 00000000 00:01 98307 /SYSV6602121c (deleted)
75e8a000-7608e000 rwxp 00000000 00:00 0...
76eeb000-76efb000 ---p 00000000 00:00 0
76efb000-76eff000 r-xp 000ce000 00:02 1234 /lib/libstdc++.so.6.0.20
76eff000-76f01000 rwxp 000d2000 00:02 1234 /lib/libstdc++.so.6.0.20
76f01000-76f08000 rwxp 00000000 00:00 0
76f08000-76f0f000 r-xp 00000000 00:02 1235 /lib/ld-uClibc-0.9.33.2.so
76f1a000-76f1e000 rwxp 00000000 00:00 0
76f1e000-76f1f000 rwxp 00006000 00:02 1235 /lib/ld-uClibc-0.9.33.2.so
76f1f000-76f20000 ---p 00000000 00:00 0...
7c720000-7cf1f000 rwxp 00000000 00:00 0 [stack:30574]
7cf1f000-7cf20000 ---p 00000000 00:00 0
7cf20000-7e121000 rwxp 00000000 00:00 0 [stack:30575]
7eef7000-7ef18000 rwxp 00000000 00:00 0 [stack]
7efb7000-7efb8000 r-xp 00000000 00:00 0 [sigpage]
ffff0000-ffff1000 r-xp 00000000 00:00 0 [vectors]


通过多次maps对比,可以发现[stack:TID]类型的内存以及一个匿名内存在不停增加消耗内存。

其中[stack:TID]类型的内存,在内核查找相关代码没有明确对应属性。初步判断是线程的栈,TID表示线程id号。

所以这里应该是某个线程泄漏。

2.1 线程栈泄漏(Joinable线程栈)

一个导致线程栈泄漏原因可能是对于一个Joinable线程,系统会创建线程私有的栈、threand ID、线程结束状态等信息。

如果此线程没有pthread_join(),那么系统不会对以上信息进行回收。这就可能造成线程栈等泄漏。

确定线程栈泄漏的方法是:通过ls /proc/<pid>/task | wc -l确定进程下线程数目。然后在maps中检查[stack:TID]数目。两者如果不一致,则存在Joinable线程没有调用pthread_join()造成的泄漏。

如果maps没有[stack:TID],可以通过pmap <pid> | grep <stack size> | wc -l,即通过检查栈大小的vma数目来确定栈数目。

关于线程内存泄漏参考:《Avoiding memory leaks in POSIX thread programming》

3. 问题根源

通过检查线程栈消耗与实际线程数目,发现两者数目吻合。所以线程并没有退出。也即不是由于未使用pthread_join()导致的内存泄漏。

然后根据maps中[stack:TID]的pid号,cat /proc/<pid>/comm发现是同一个线程不停创建。但是没有释放。

其实通过top -H -p <pid>和maps也可发现问题,中间走了弯路。

所以问题的根源是,进程不停创建但是没有退出造成内存消耗殆尽

4. 收获

有两个收获,一是创建的pthread线程Join和Detach两种状态下内存处理差别;

二是在进程maps中显示线程栈[stack:TID]更有利于调试。

4.1 pthread线程的join和detach区别

《Avoiding memory leaks in POSIX thread programming》讲到如何避免POSIX线程编程时内存泄漏。

https://developer.ibm.com/tutorials/l-memory-leaks/

首先pthread_create()创建的线程默认是joinable的。

对于joinable线程,系统会分配私有内存存储线程结束状态、线程栈、线程ID等等资源。这些资源会一直存在,直到线程结束并且线程被其他线程joined。

所以确保joinable线程资源得到释放的两个条件是:线程退出、被其他线程joined

对于detached线程,如果其退出,那么系统会自动回收其占用的资源。

关于joinable线程没有被其他线程joined造成内存泄漏的实验。

#include<stdio.h>
#include<pthread.h>

void run() {
pthread_exit(0);
}

int main () {
pthread_t thread;
int rc;
long count = 0;
while(1) {
if(rc = pthread_create(&thread, 0, run, 0) ) {
printf("ERROR, rc is %d, so far %ld threads created\n", rc, count);
perror("Fail:");
return -1;
}
usleep(10);
count++;
}
return 0;
}


输出结果如下:

ERROR, rc is 11, so far 32751 threads created
Fail:: Cannot allocate memory

总共创建了32571个线程,造成内存消耗殆尽。

通过对比中间过程的maps,可以发现每次增加一个8MB的栈以及一个分隔页。


在pthread_create()之后增加pthread_join()则内存非常稳定。

#include<stdio.h>
#include<pthread.h>

void run() {
pthread_exit(0);
}

int main () {
pthread_t thread;
int rc;
long count = 0;
while(1) {
if(rc = pthread_create(&thread, 0, run, 0) ) {
printf("ERROR, rc is %d, so far %ld threads created\n", rc, count);
perror("Fail:");
return -1;
}
pthread_join(thread, NULL);
usleep(10);
count++;
}
return 0;
}


借用文档里面一句话总结一下:

Joinable threads should be joined during programming.

If you are creating joinable threads in your program, don’t forget to call pthread_join(pthread_t, void**) to recycle the private storage allocated to the thread.

调用pthread_join()将阻塞线程自己,一直等到加入的线程运行结束。

线程可以分为两种:joined和detached。并不是所有线程创建后都默认joinable,需要显式指定属性。

joinable线程在创建后,可以通过pthread_detach()显式分离。在分离后,不可以再合并。

如果一个线程结束运行,但没有被join。则它的状态类似进程中的Zombie Process,即还有一部分资源没有被回收,所以创建线程者应该调用pthread_join()来等待线程结束,并可得到线程的退出代码,回收其资源。

如果父进程调用pthread_detach(child_thread_id)或者子进程调用pthread_detack(pthread_self())即可将子进程状态设置为detached,该程序运行结束后会自动释放所有资源。

4.2 关于在maps中显示[stack:TID]

在进程maps中显示线程栈信息,最后在内核中被放弃。

首先在《procfs: mark thread stack correctly in proc/<pid>/maps》中,添加了[stack:TID]用于表示此vma对应的是线程TID的stack区域。

这样做的好处是,可以从maps中明确知道此段vma是被哪个线程使用的。

有一个坏处就是先线程非常多情况下,主线程中为了显示[stack:TIS],开销就会很大,而实际上用处不是很大。

所以在《proc: revert /proc/<pid>/maps [stack:TID] annotation》将进程maps中的[stack:TID]删除了,只显示为匿名内存。

Detecting leaks

Just as in other memory leaks, the problem may not be obvious when the process is started. So here’s a way to detect such problems without needing to access source code:

Count the number of thread stacks in the process. That includes the number of running active threads and terminated threads.

Count the number of active running threads in the process.

Compare the two. If the number of the existing thread stacks is greater than the number of active running threads, and the dispersion of these two numbers keeps increasing as the program continues running, then memory is leaking.

Use /proc/PID/task to count active threads
[root@oceanbase task]# ls /proc/29363/task | wc -l
555
Use pmap to count thread stacks
cat /proc/29363/maps |grep stack |wc -l
555

----- 1 root root 64 Aug 14 17:19 1032 -> anon_inode:[eventpoll]
lrwx------ 1 root root 64 Aug 14 17:19 1031 -> anon_inode:[eventfd]
lrwx------ 1 root root 64 Aug 14 17:19 1030 -> anon_inode:[eventpoll]
lrwx------ 1 root root 64 Aug 14 17:19 1029 -> anon_inode:[eventfd]
lrwx------ 1 root root 64 Aug 14 17:19 1028 -> anon_inode:[eventpoll]
lrwx------ 1 root root 64 Aug 14 17:19 1027 -> anon_inode:[eventfd]
lrwx------ 1 root root 64 Aug 14 17:19 1026 -> anon_inode:[eventpoll]
lrwx------ 1 root root 64 Aug 14 17:19 1025 -> anon_inode:[eventfd]
lrwx------ 1 root root 64 Aug 14 17:19 1024 -> anon_inode:[eventpoll]
lrwx------ 1 root root 64 Aug 14 17:19 1023 -> anon_inode:[eventfd]
lrwx------ 1 root root 64 Aug 14 17:19 1022 -> anon_inode:[eventpoll]
lrwx------ 1 root root 64 Aug 14 17:19 1021 -> anon_inode:[eventfd]
lrwx------ 1 root root 64 Aug 14 17:19 1020 -> anon_inode:[eventpoll]
lrwx------ 1 root root 64 Aug 14 17:19 1019 -> anon_inode:[eventfd]
lrwx------ 1 root root 64 Aug 14 17:19 1018 -> anon_inode:[eventpoll]
lrwx------ 1 root root 64 Aug 14 17:19 1017 -> anon_inode:[eventfd]
lrwx------ 1 root root 64 Aug 14 17:19 1016 -> anon_inode:[eventpoll]
lrwx------ 1 root root 64 Aug 14 17:19 1015 -> anon_inode:[eventfd]
lrwx------ 1 root root 64 Aug 14 17:19 1014 -> anon_inode:[eventpoll]
lrwx------ 1 root root 64 Aug 14 17:19 1013 -> anon_inode:[eventfd]
lrwx------ 1 root root 64 Aug 14 17:19 1012 -> anon_inode:[eventpoll]
lrwx------ 1 root root 64 Aug 14 17:19 1011 -> anon_inode:[eventfd]
lrwx------ 1 root root 64 Aug 14 17:19 1010 -> anon_inode:[eventpoll]
lrwx------ 1 root root 64 Aug 14 17:19 1009 -> anon_inode:[eventfd]
lrwx------ 1 root root 64 Aug 14 17:19 1008 -> anon_inode:[eventpoll]
lrwx------ 1 root root 64 Aug 14 17:19 1007 -> anon_inode:[eventfd]
lrwx------ 1 root root 64 Aug 14 17:19 1006 -> anon_inode:[eventpoll]
lrwx------ 1 root root 64 Aug 14 17:19 1005 -> anon_inode:[eventfd]
lrwx------ 1 root root 64 Aug 14 17:19 1004 -> anon_inode:[eventpoll]
lrwx------ 1 root root 64 Aug 14 17:19 1003 -> anon_inode:[eventfd]
lrwx------ 1 root root 64 Aug 14 17:19 1002 -> anon_inode:[eventpoll]
lrwx------ 1 root root 64 Aug 14 17:19 1001 -> anon_inode:[eventfd]
lrwx------ 1 root root 64 Aug 14 17:19 1000 -> anon_inode:[eventpoll]
[root@oceanbase fd]#


最终再《fs/proc: Stop trying to report thread stacks》将所有[stack:TID]全部移除。

那么在没有[stack:TID]的情况下如何断定vma是否是线程栈呢?

首先线程栈大小可以通过ulimit -s查看,所以maps中vma大小和这个一致;并且属性应该是匿名的rw-p。

然后上面应该是一页大小作为分隔区间,分隔页的属性应该是---p。

- END -


关注,回复【1024】海量Linux资料赠送

 精彩文章合集

linux入门
C语言
Linux驱动
ARM
计算机网络
粉丝问答
所有原创
点击“阅读原文”查看更多分享,欢迎点分享、收藏、点赞、在看
一口Linux 写点代码,写点人生!
评论
  • 光伏逆变器是一种高效的能量转换设备,它能够将光伏太阳能板(PV)产生的不稳定的直流电压转换成与市电频率同步的交流电。这种转换后的电能不仅可以回馈至商用输电网络,还能供独立电网系统使用。光伏逆变器在商业光伏储能电站和家庭独立储能系统等应用领域中得到了广泛的应用。光耦合器,以其高速信号传输、出色的共模抑制比以及单向信号传输和光电隔离的特性,在光伏逆变器中扮演着至关重要的角色。它确保了系统的安全隔离、干扰的有效隔离以及通信信号的精准传输。光耦合器的使用不仅提高了系统的稳定性和安全性,而且由于其低功耗的
    晶台光耦 2024-12-02 10:40 125浏览
  •         温度传感器的精度受哪些因素影响,要先看所用的温度传感器输出哪种信号,不同信号输出的温度传感器影响精度的因素也不同。        现在常用的温度传感器输出信号有以下几种:电阻信号、电流信号、电压信号、数字信号等。以输出电阻信号的温度传感器为例,还细分为正温度系数温度传感器和负温度系数温度传感器,常用的铂电阻PT100/1000温度传感器就是正温度系数,就是说随着温度的升高,输出的电阻值会增大。对于输出
    锦正茂科技 2024-12-03 11:50 115浏览
  • 作为优秀工程师的你,已身经百战、阅板无数!请先醒醒,新的项目来了,这是一个既要、又要、还要的产品需求,ARM核心板中一个处理器怎么能实现这么丰富的外围接口?踌躇之际,你偶阅此文。于是,“潘多拉”的魔盒打开了!没错,USB资源就是你打开新世界得钥匙,它能做哪些扩展呢?1.1  USB扩网口通用ARM处理器大多带两路网口,如果项目中有多路网路接口的需求,一般会选择在主板外部加交换机/路由器。当然,出于成本考虑,也可以将Switch芯片集成到ARM核心板或底板上,如KSZ9897、
    万象奥科 2024-12-03 10:24 68浏览
  • RDDI-DAP错误通常与调试接口相关,特别是在使用CMSIS-DAP协议进行嵌入式系统开发时。以下是一些可能的原因和解决方法: 1. 硬件连接问题:     检查调试器(如ST-Link)与目标板之间的连接是否牢固。     确保所有必要的引脚都已正确连接,没有松动或短路。 2. 电源问题:     确保目标板和调试器都有足够的电源供应。     检查电源电压是否符合目标板的规格要求。 3. 固件问题: &n
    丙丁先生 2024-12-01 17:37 102浏览
  • TOF多区传感器: ND06   ND06是一款微型多区高集成度ToF测距传感器,其支持24个区域(6 x 4)同步测距,测距范围远达5m,具有测距范围广、精度高、测距稳定等特点。适用于投影仪的无感自动对焦和梯形校正、AIoT、手势识别、智能面板和智能灯具等多种场景。                 如果用ND06进行手势识别,只需要经过三个步骤: 第一步&
    esad0 2024-12-04 11:20 59浏览
  • 最近几年,新能源汽车愈发受到消费者的青睐,其销量也是一路走高。据中汽协公布的数据显示,2024年10月,新能源汽车产销分别完成146.3万辆和143万辆,同比分别增长48%和49.6%。而结合各家新能源车企所公布的销量数据来看,比亚迪再度夺得了销冠宝座,其10月新能源汽车销量达到了502657辆,同比增长66.53%。众所周知,比亚迪是新能源汽车领域的重要参与者,其一举一动向来为外界所关注。日前,比亚迪汽车旗下品牌方程豹汽车推出了新车方程豹豹8,该款车型一上市就迅速吸引了消费者的目光,成为SUV
    刘旷 2024-12-02 09:32 123浏览
  • 当前,智能汽车产业迎来重大变局,随着人工智能、5G、大数据等新一代信息技术的迅猛发展,智能网联汽车正呈现强劲发展势头。11月26日,在2024紫光展锐全球合作伙伴大会汽车电子生态论坛上,紫光展锐与上汽海外出行联合发布搭载紫光展锐A7870的上汽海外MG量产车型,并发布A7710系列UWB数字钥匙解决方案平台,可应用于数字钥匙、活体检测、脚踢雷达、自动泊车等多种智能汽车场景。 联合发布量产车型,推动汽车智能化出海紫光展锐与上汽海外出行达成战略合作,联合发布搭载紫光展锐A7870的量产车型
    紫光展锐 2024-12-03 11:38 105浏览
  • 概述 说明(三)探讨的是比较器一般带有滞回(Hysteresis)功能,为了解决输入信号转换速率不够的问题。前文还提到,即便使能滞回(Hysteresis)功能,还是无法解决SiPM读出测试系统需要解决的问题。本文在说明(三)的基础上,继续探讨为SiPM读出测试系统寻求合适的模拟脉冲检出方案。前四代SiPM使用的高速比较器指标缺陷 由于前端模拟信号属于典型的指数脉冲,所以下降沿转换速率(Slew Rate)过慢,导致比较器检出出现不必要的问题。尽管比较器可以使能滞回(Hysteresis)模块功
    coyoo 2024-12-03 12:20 127浏览
  • 11-29学习笔记11-29学习笔记习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-02 23:58 73浏览
  • 遇到部分串口工具不支持1500000波特率,这时候就需要进行修改,本文以触觉智能RK3562开发板修改系统波特率为115200为例,介绍瑞芯微方案主板Linux修改系统串口波特率教程。温馨提示:瑞芯微方案主板/开发板串口波特率只支持115200或1500000。修改Loader打印波特率查看对应芯片的MINIALL.ini确定要修改的bin文件#查看对应芯片的MINIALL.ini cat rkbin/RKBOOT/RK3562MINIALL.ini修改uart baudrate参数修改以下目
    Industio_触觉智能 2024-12-03 11:28 87浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦