gdb调试多线程 如何解死锁问题

基础_多线程

Q1 gdb调试多线程 如何解死锁问题?

A1

说明:排版不是很好可以直接查看原文链接

gdb基本用法

info threads(show all thread) thread thread number (switch ) thread apply all break demo.cpp:42(all)

eg: 同一个功能A,创建N个线程 同一个功能B,创建M个线程 来抢夺和释放资源C,D

不清楚那个线程 有限占用或者释放资源

产生问题1 跟踪那个线程ID

代码实现顺序实际执行顺序是不一致的, 一般无法通过查看代码快速定位 thread ID id用那个呀?

thread apply all break demo.cpp:19 thread apply all break demo.cpp:42

pthread_mutex_t mymutex 公共资源: 两个线程同时抢占 p mymutex

显示了当前占用的线程(上图) 当前目前线程位于5882 但是被 __owner = 5883锁住

* 1 Thread 0x7ffff7fe1780 (LWP 5882。 2 Thread 0x7ffff6d6d700 (LWP 5883)

thread ID找到啦

总结: 
pthread_mutex_t.data.owner 
is a TID. pthread_t (frompthread_self()). 

typedef union 
{ 
struct __pthread_mutex_s 
{ 
int __lock; 
unsigned int __count; 
int __owner; 
#if __WORDSIZE == 64 
unsigned int __nusers; 
#endif 
/* KIND must stay at this position in the structure to maintain 
binary compatibility. */ 
int __kind; 
#if __WORDSIZE == 64 
int __spins; 
__pthread_list_t __list; 
# define __PTHREAD_MUTEX_HAVE_PREV 1 
#else 
unsigned int __nusers; 
__extension__ union 
{ 
int __spins; 
__pthread_slist_t __list; 
}; 
#endif 
} __data; 
char __size[__SIZEOF_PTHREAD_MUTEX_T]; 
long int __align; 
} pthread_mutex_t; 

产生问题2 gdb默认调试当前主线程

thread apply all command 表示 all 所有线程中相应的行上设置断点 你发现一个问题 调试期间(next)不断的不同线程来回切换, (如果谁发现不是麻烦告知) 线程是cpu调度的最小单位 因为分片原因 cpu不断在不同线程之间切换 注意不是进程进程可以理解为一个主线程

set scheduler-locking on 只调试当前线程

产生问题3 如果进程有fork 如何办?

If you need to debug the child process, after the start gdb: (Gdb) set follow-fork-mode child off

查询正在调试的进程:info inferiors 切换调试的进程:inferior id

如何分析思路

  • 不用gdb: 假如100个线程 此时10个线程因为资源问题产生了死锁 gdb调试会影响业务

可通过日志或者其他方式打印超时锁 然后pstack +进程ID 查看堆栈信息

  • 用gdb 1 通过gcore或者gdb -p方式 进入 2 设置断点 thread apply all commd 等待一段时间产生死锁 3 p pthread_mutex_t 确定目前那个线程占用 至少2个 一个不会产生死锁 加锁顺序
  • 其他工具 Valgrind 的 helgrind 工具也可以检测死锁。 用法: valgrind –tool=helgrind ./deadlock http://valgrind.org/docs/manual/hg-manual.html

给出了详细的例子和说明

1.#include <pthread.h>2.int var = 0;3.void* child_fn ( void* arg ) {4.   var++; /* Unprotected relative to parent */ /* this is line 6 */5.   return NULL;6.}7.8.int main ( void ) {9.   pthread_t child;10.   pthread_create(&child, NULL, child_fn, NULL);11.   var++; /* Unprotected relative to child */ /* this is line 13 */12.   pthread_join(child, NULL);13.   return 0;14.}

变量var没有加锁

1. ==7066== Possible data race during read of size 4 at 0x601040 by thread #12.==7066== Locks held: none3.==7066==    at 0x4006C1: main (lock.cpp:13)4.==7066== 5.==7066== This conflicts with a previous write of size 4 by thread #26.==7066== Locks held: none7.==7066==    at 0x400691: child_fn(void*) (lock.cpp:6)8.==7066==    by 0x4C3094E: mythread_wrapper (hg_intercepts.c:389)9.==7066==    by 0x50B2DF4: start_thread (in /usr/lib64/libpthread-2.17.so)10.==7066==    by 0x5BDD1AC: clone (in /usr/lib64/libc-2.17.so)11.==7066==  Address 0x601040 is 0 bytes inside data symbol "var"

参考

http://www.cnblogs.com/zhuyp1015/p/3618863.html kill -11不可取 用gcore http://blog.csdn.net/pbymw8iwm/article/details/7876797

pthread_mutex_t struct: What does lock stand for http://stackoverflow.com/questions/23449508/pthread-mutex-t-struct-what-does-lock-stand-for

Understanding deadlock behavior with gdb http://stackoverflow.com/questions/21017794/understanding-deadlock-behavior-with-gdb

Helgrind: a thread error detector http://valgrind.org/docs/manual/hg-manual.html

原文发布于微信公众号 - 架构说(JiaGouS)

原文发表时间:2016-05-07

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Janti

记一次内存溢出的分析经历——thrift带给我的痛orz

说在前面的话 朋友,你经历过部署好的服务突然内存溢出吗? 你经历过没有看过Java虚拟机,来解决内存溢出的痛苦吗? 你经历过一个BUG,百思不得其解,头发一根一...

55580
来自专栏LhWorld哥陪你聊算法

【ElasticSearch篇】--ElasticSearch从初识到安装和应用

ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口,在企业中全文搜索时,特...

16020
来自专栏微服务生态

论代码级性能优化变迁之路(二)

在上一篇我们主要介绍了所遇到问题的五点,那么今天接下来讨论剩下的问题,我们先再回顾一下之前讨论的问题:

8820
来自专栏Java后端技术

Spring+SpringMvc+Mybatis框架集成搭建教程一(项目创建)

  2.选择Maven->Create from artchetype并选择如下图红框中的骨架

8710
来自专栏后端技术探索

PHP并发IO编程之路

并发IO问题一直是后端编程中的技术挑战,从最早的同步阻塞Fork进程,到多进程/多线程,到现在的异步IO、协程。PHP程序员因为有强大的LAMP框架,对底层方面...

31710
来自专栏大闲人柴毛毛

Java基础笔记——学习Java前的准备

        接下来的一个月我会和大家分享我学JavaSE时候的笔记,分享是最好的老师,希望我的笔记能给大家一些帮助。 我会每天发一篇文章,这些都是我学Jav...

37090
来自专栏Coding01

跟着《架构探险》学轻量级微服务架构 (二)

上一篇主要简单搭建了 Spring Boot 框架,写了一个简单的路由/hello,Spring Boot 的其它功能根据后续的学习,再不断完善,接下来我们开始...

7120
来自专栏java一日一条

Android 中构建快速可靠的 UI 测试

让我一起来看看 Iván Carballo和他的团队是如何使用Espresso, Mockito 和Dagger 2 编写250个UI测试,并且只花了三分钟就运...

6710
来自专栏黑泽君的专栏

day69_淘淘商城项目_02

  由于淘淘商城是基于soa的架构,表现层和服务层是不同的工程。所以要实现商品列表查询需要两个系统之间进行通信。   如何实现远程通信?

38320
来自专栏salesforce零基础学习

salesforce零基础学习(八十五)streaming api 简单使用(接近实时获取你需要跟踪的数据的更新消息状态)

Streaming API参考链接: https://trailhead.salesforce.com/en/modules/api_basics/units/...

34880

扫码关注云+社区

领取腾讯云代金券