前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >一文搞懂Linux多线程【下】

一文搞懂Linux多线程【下】

作者头像
用户11173787
发布2024-08-20 19:37:07
1220
发布2024-08-20 19:37:07
举报
文章被收录于专栏:破晓

在观看本博客之前,建议大家先看一文搞懂Linux多线程【上】由于上一篇博客篇幅太长,为了更好的阅读体验,我拆成了两篇博客。那么接下来,在上一篇的基础上,我们继续学习Linux信号部分。今天,我们主要学习Linux多线程控制问题。

🚩多线程代码的健壮性

一份代码写的如何,一项重要的指标就是这份代码的健壮性

我们来写一份代码:

代码语言:javascript
复制
#include<pthread.h>
#include<iostream>
#include<unistd.h>
#include<cassert>
using namespace std;

int g_val=0;
void* pthread_routine(void *args)
{
    while(1)
    {
         cout<<"我是新进程,我正在运行,g_val:"<< g_val++<<"  &g_val: "<<&g_val<<endl;
         int n=0;
         n=n/0;
        //  发生除零错误,
         sleep(1);
    }
   

}
int main()
{
    pthread_t tid;
    int n=pthread_create(&tid,nullptr,pthread_routine,(void *)"thread one");
    assert(n==0);
    (void)n;

    while(1)
    {
        cout<<"我是主进程,我正在运行,g_val:"<<g_val<<"   &g_val:"<<&g_val<<endl;
        sleep(1);
    }
    return 0;

}

在新线程中,出现了除零错误。

我们发现:新线程和主线程一起被干掉了。为什么?

这是因为代码中出现了错误,操作系统堆整个进程发送信号,操作系统要回收这个进程的资源,而线程是从进程那里得到的字眼,进程都没了,线程也就没法存在了。这个进程中的所有的线程都会被终止。

举个例子:在某互联网大厂,张三是一名程序员,他所在项目组敷个某个程序的开发。有一天,张三在写代码之前干了一瓶二锅头,代码中出现了很严重的bug,张三写代码出现了问题,就是这个项目组出现了问题。公司要对这个事情做出惩罚。所以就对张三的项目组长进行了谈话和警告。这个项目组就是一个进程,项目组的每一个成员就是一个线程(轻量级进程)。成员出现了错误,自然要惩罚这个项目组。

所以:多线程的代码的健壮性非常不好,这也是线程很大的一个缺点。

🚩多线程控制

Linux多线程控制是一个很重要的部分,这其中包括线程创建,线程等待,线程替换等等话题。

🚀Linux线程创建

我们在之前讲过如何创建线程,今天,我想一次性创建多个线程。让一个进程中包括若干个执行流。并同时运行。

代码语言:javascript
复制
#include<pthread.h>
#include<iostream>
#include<unistd.h>
#include<cassert>
using namespace std;
void *start_routine(void *args)
{
    char *buf=static_cast<char*>(args);
    int cnt=10;
    while(cnt)
    {
        cout<<"我是新线程, "<<buf<<" cnt:"<<cnt<<endl;
        cnt--;
        sleep(1);
    }
}
int main()
{
    for(int i=0;i<10;i++)
    {
        pthread_t id;
        char buffer[64];
        snprintf(buffer,sizeof buffer,"%s:%d","thread",i);
        pthread_create(&id,nullptr,start_routine,buffer);

    }
    while(1)
    {
        cout<<"我是新线程,我一直在运行"<<endl;
        sleep(1);
    }
}

我们发现:我们创建的新线程的打印信息都是thread:9 。但是我们通过命令查询到我们的确创建了多个线程。但为什么都是9号呢?

我们知道,如上的两点代码是两个不同的执行流,究竟是哪个执行流先被执行呢?不确定,这是由编译器的调度顺序决定的。但是我们的运行的结果证明是主线程先被执行。为什么?

我们在for循环中定义了一个字符串,在pthread_create循环中传入了字符串的起始地址。有没有可能这块空间里的内容在被打印之前就被修改了呢?事实证明就是如此。主线程在新线程读取字符串内容之前,先将字符串的内容进行了修改。

这种现象的背后的根本原因是:字符串是一个共享资源,被所有线程所共享。由此造成这一系列问题。

如何更改这种现象呢?

代码语言:javascript
复制
#include<pthread.h>
#include<iostream>
#include<unistd.h>
#include<cassert>
using namespace std;


class Threads
{
public:
    pthread_t id;
    char buffer[64];
};

void* pthread_routine(void *args)
{
    int cnt=5; 
    Threads *newThreads=static_cast<Threads *>(args); 
    while(cnt--)
    {  
         cout<<"new thread make success,name:  "<<newThreads->buffer<<" cnt:"<<cnt<<endl;    
         sleep(1);

    }
    // delete newThreads;
    // return nullptr;

}
int main()
{
   for(int i=0;i<10;i++)
   {
        Threads *id=new Threads();
        snprintf(id->buffer,sizeof(id->buffer),"%s:%d","thread",  i);
        pthread_create(&id->id,nullptr,pthread_routine,id);
     
   }
    while(1)
    {
        cout<<"我是主进程,我正在运行"<<endl;
        sleep(1);
    }
    return 0;
}

我们顶定义一个类,每个线程被创建之初都会创建一个独立的类对象,这个类归线程所属,是私有的,所以不会出现上面的情况,关于这个类的相关数据储存在哪里,我们后面再谈。

接下来,我们就改过的代码来回答几个问题:

在这份代码中,start_routine函数被几个执行流执行呢?10个

start_routine函数处于什么状态?可重入状态。

那这个函数是可重入函数吗?是的。


这个函数内的变量是被所有的线程共享的吗?我们实验一下:

我们对打印内容做稍稍改动:

我们发现:不同的执行流的cnt地址都不同,说明每一个线程都有一个独立的栈结构。 至于在什么位置,我们后面再说。

线程创建我们掌握了,那如何让线程终止呢?


🚀Linux线程终止

方法一

在线程对应的代码中,return返回,这个线程就终止了。

但是不能调用exit函数,我们说过exit是用来终止进程的,这时所有的线程都会跟着终止。

方法二

调用pthread_exit函数

该函数的作用是终止调用这个函数的线程。

参数我们默认设为nullptr。

方法三

一个跑起来的线程是可以被取消的。取消线程的函数为pthread_cancel。下面,我们简单介绍一下:

代码语言:javascript
复制
#include <pthread.h>
 int pthread_cancel(pthread_t thread);

参数很简单,一看就明白

返回值:成功时返回0,失败错误码被设置。

下面,我们感受一下:

代码语言:javascript
复制
#include<pthread.h>
#include<iostream>
#include<unistd.h>
#include<cassert>
#include<vector>
#include<string>
using namespace std;

class Threads
{
public:
    pthread_t id;
    char buffer[64];
};
class ThreadReturn
{
public:
     int return_result;
     int return_code;
};
void* pthread_routine(void *args)
{
    int cnt=5; 
    Threads *newThreads=static_cast<Threads *>(args); 
    while(cnt--)
    {  
         cout<<"new thread make success,name:  "<<newThreads->buffer<<endl;

         sleep(1);
     } 
     
     return (void*)123;
}
int main()
{
   vector<Threads *> iter;
   for(int i=0;i<10;i++)
   {
        Threads *id=new Threads();
        snprintf(id->buffer,sizeof(id->buffer),"%s:%d","thread",  i);
        pthread_create(&id->id,nullptr,pthread_routine,id);
        iter.push_back(id);
   }
   sleep(5);
//    将创建的线程先取消一半
   for(int i=0;i<iter.size()/2;i++)
   {
          pthread_cancel(iter[i]->id);
          cout<<"pthread_cancel:"<<iter[i]->buffer<<" successful"<<endl;
   }
   for(auto &it:iter)
   {

        void *ret;
        int n = pthread_join(it->id, (void**)&ret); 
        assert(n == 0);
        cout << "join " << it->id << " successful" <<(long long)ret<< endl;
   }
   cout<<"main thread quit"<<endl;

}

如果一个线程被pthread_cancel取消,这个线程的返回值会被设为-1。

🚀Linux线程等待

线程也是需要等待的,如果不等待,会造成类似僵尸进程问题,否则会造成内存泄漏。线程必须要被等待的。等待工作需要:

  1. 获取新线程的退出信息。
  2. 回收新线程对应的PCB资源,防止内存泄漏。

所以,我们有必要且必须对线程进行等待,线程等待函数是pthread_join。下面,我们简单介绍一下这个函数。

参数:

第一个参数为:要等待的线程的thread,第二个我们先不需要了解,默认为nullptr。

返回值:

等待成功,返回0;等待失败,返回相应的错误码。

接下来,我们来试一下:

代码语言:javascript
复制
#include<pthread.h>
#include<iostream>
#include<unistd.h>
#include<cassert>
#include<vector>
using namespace std;

class Threads
{
public:
    pthread_t id;
    char buffer[64];
};

void* pthread_routine(void *args)
{
    int cnt=5; 
    Threads *newThreads=static_cast<Threads *>(args); 
    while(cnt--)
    {  
         cout<<"new thread make success,name:  "<<newThreads->buffer<<" cnt:"<<cnt<<" &cnt"<<&cnt<<endl;    
         sleep(1);
     } 
     pthread_exit(nullptr);
}
int main()
{
   vector<Threads *> iter;
   for(int i=0;i<10;i++)
   {
        Threads *id=new Threads();
        snprintf(id->buffer,sizeof(id->buffer),"%s:%d","thread",  i);
        pthread_create(&id->id,nullptr,pthread_routine,id);
        iter.push_back(id);
   }
   for(auto &it:iter)
   {
        int n=pthread_join(it->id,nullptr);
        assert(n==0);
        cout<<"join "<<it->id<<" successful"<<endl;
   }
   cout<<"main thread quit"<<endl;

}

运行一下:

如我们所见:所有的线程同一时间全部退出,接着主线程退出。

🚀Linux线程分离

  • ‘’默认情况下,新创建的线程是joinable的,线程退出后,需要对其进行pthread_join操作,否则无法释放资源,从而造成系统泄漏。
  • 如果不关心线程的返回值,join是一种负担,这个时候,我们可以告诉系统,当线程退出时,自动释放线程资源。
  • 一个线程被分离,就不能调用pthread_join()进行线程等待。

接下来,我们简单介绍一下几个函数。

pthread_self()

代码语言:javascript
复制
       #include <pthread.h>

       pthread_t pthread_self(void);

使用起来很简单,作用就是返回调用该线程的Id。由于太简单,这里我们就不再演示了。

pthread_detech()

代码语言:javascript
复制
       #include <pthread.h>

       int pthread_detach(pthread_t thread);

参数很简单,要对哪个线程进行分离,就传入哪个线程的Id。

返回值;成功的话,返回0;失败时,错误码被设置。

接下来,我们尝试使用一下:

代码语言:javascript
复制
#include<pthread.h>
#include<iostream>
#include<unistd.h>
#include<cassert>
#include<vector>
#include<string>
#include<cstring>
using namespace std;

string changeId(const pthread_t  &id)
{
     char buffer[128];
     snprintf(buffer,sizeof buffer,"0x%x",id);
     return buffer;
}
void *start_routine(void *args)
{
     pthread_detach(pthread_self());
     int cnt=5;
     while(cnt)
     {
          cout<<"new spthread running..... Id:"<< changeId(pthread_self())<<endl;
          sleep(1);
          cnt--;
     }
}
int main()
{
     pthread_t id;
     int n=pthread_create(&id,nullptr,start_routine,(void*)"thread noe");
     assert(n==0);
     (void)n;
     pthread_detach(id);
    
     sleep(5);

    
     return 0;
}

这个函数的调用原则为:一般让主线程对新线程进行分离,在主线程中进行调用。

🚩线程返回值问题

我们刚刚在讲解pthread_join()和pthread_exit()函数时,我们一般将参数设为nullptr。至于原因,我们当时没说,现在我们就来分析一下这些参数。这些参数都是输出

一切的一切都在告诉我们这个参数不简单,我们先写个代码试一下这个参数的作用。

代码语言:javascript
复制
#include<pthread.h>
#include<iostream>
#include<unistd.h>
#include<cassert>
#include<vector>
using namespace std;

class Threads
{
public:
    pthread_t id;
    char buffer[64];
};

void* pthread_routine(void *args)
{
    int cnt=5; 
    Threads *newThreads=static_cast<Threads *>(args); 
    while(cnt--)
    {  
         cout<<"new thread make success,name:  "<<newThreads->buffer<<endl;

         sleep(1);
     } 
     
     return (void*)123;
}
int main()
{
   vector<Threads *> iter;
   for(int i=0;i<10;i++)
   {
        Threads *id=new Threads();
        snprintf(id->buffer,sizeof(id->buffer),"%s:%d","thread",  i);
        pthread_create(&id->id,nullptr,pthread_routine,id);
        iter.push_back(id);
   }
   for(auto &it:iter)
   {
     
          void *ret;
        int n=pthread_join(it->id,&ret);

        assert(n==0);
        cout<<"join "<<it->id<<" successful"<<" ret:"<<(long long)ret<<endl;
   }
   cout<<"main thread quit"<<endl;

}

我们在线程调用的函数中返回了 return (void*)123;

运行一下:

看,我们输入的123成功读取到了 。我们是怎么做到的?为了方便叙述,我将相关的代码块拎出来。

请看如下图:pthread_join的第二个参数是输出型参数

在pthread库中,有一个变量存储的数据为void* 。我们将在线程函数的返回值强转成void*,存储在这个变量中,我们暂且将这个存储的数据叫做X数据。

现在,我们在代码层面同样定义了一个void*的变量ret。如何将X数据转到我们用户层面的ret中呢?办法有两种:

方案1:直接把x的值赋值给ret。因为他们都是一级指针,解引用就可以得到数据(123)。

方案2:对ret取地址,对数据X取地址,都得到二级指针,然进行赋值,再解引用得到数据(123)。

在这里,OS采用的是第二种方式。因为我们调用的是函数来获取,无法实现简单的赋值。

接下来,我们看图理解一下

大家懂的话,可以返回任意类型的数据,但是:必须是new出来的类型,因为new出来的类型不会因为出了函数空间被释放。接下来,我给大家示范一下:

来看:

成功打出来。


进程退出时,都会设置对应的退出码,线程这里为什么没有退出码呢? 线程异常,收到信号,整个进程都会退出。

pthread_join默认就认为函数可以调用成功,不考虑异常,异常是进程应该来考虑的事情。

🚩关于Linux线程库

其实,C++也可以写多线程代码:

代码语言:javascript
复制
#include<iostream>
#include<thread>
#include<unistd.h>
using namespace  std;

void start_routine()
{
     cout<<"我是新线程"<<endl;
     sleep(1);
}
int main()
{
     std::thread t1(start_routine);
     while(1)
     {
          cout<<"我是主线程"<<endl;
          sleep(1);
     }
     t1.join();
     return 0;

}

但是,在编译时必须指明要链接pthread库。

任何语言在Linux下使用多线程,必须使用pthread库。 c++的多线程,在Linux下,本质是对pthread库的封装。


我们遗留的问题,现在有必要搞清楚了。

我们已经确认每一个线程都有自己的独立栈结构,这个栈结构在哪里? 我们每创建一个线程,都会有一个线程的Id,这个Id看起来是个地址,究竟是什么地址?

原生线程库中有可能会存在很多的线程,要不要对这些进行有效的管理?要,管理的方式就是先描述,再组织。相对于进程的属性,线程的属性就显得非常少,因为在进程的PCB中,有一部分属性就是线程的属性。

如图,用户每在用户层面创建一个线程,就会在pthread库中创建一个属性集数据结构,该属性集指向操作系统内的一个用户级进程。

在该属性集中一定包括线程独立栈的地址,LWP值等等。

Linux方案:用户级进程,用户关心的线程属性在库中,内核(操作系统)负责提供操作系统执行流的调度。 Linux用户级线程:轻量级进程=1:1;

用户级线程库可以当作磁盘中的一个文件(也就是一个动态库)。该线程库经过映射,可以通过mmap区域找到这个动态库。一个进程的所有线程的属性集(就是TCB结构体)都会被保存在这里。 我们可以想象成一个数组。但是我们不是通过下标查找。我们创建线程返回的地址,就是对应线程的TCP在此处的起始地址,通过这个地址就可以找到这个线程私有的栈结构。

那创建一个线程,pthread库应该帮我们做哪个工作呢? 帮我们在pthread库中创建线程控制块(TCB)。然后返回TCB的起始地址,便于用户对线程进行操作。属于新线程私有的数据都会存储在线程私有栈中,主线程的数据则存储在共享区中。


🚀线程的局部存储。

废话不说,上码:

代码语言:javascript
复制
#include <pthread.h>
#include <iostream>
#include <unistd.h>
#include <cassert>
#include <vector>
#include <string>
#include <cstring>
using namespace std;

int g_val = 100;
void *start_routine(void *args)
{
     while (1)
     {
          cout << "new  pthread running..... g_val: " << g_val << " &g_val " << &g_val << endl;
          sleep(1);
          g_val++;
     }
}
int main()
{
     pthread_t id;
     int n = pthread_create(&id, nullptr, start_routine, (void *)"thread noe");
     assert(n == 0);
     (void)n;
     while (1)
     {
          cout << "main pthread running..... g_val: " << g_val << " &g_val " << &g_val << endl;
          sleep(1);
     }
     pthread_join(id,nullptr);
     return 0;
}

全局变量被所有进程所共享,所以新线程对数据进行修改后,主线程立刻就可以读取。

接着,我们做部分代码修改

代码语言:javascript
复制
__thread int g_val = 100;

我们发现,新线程对数据进行修改,但主线程读取的数据并未改变,并且地址读取的地址也不同。

对比,我们发现,前后地址差别好大。这就是__thread的作用了。

__thread的作用是什么? 在一个全局变量前加__thread,可以将一个内置类型设置为线程局部存储(就本例子而言,未添加前,数据存储在已初始化数据段;添加后,在运行时,会将数据给每个线程都拷贝一份,存储在自己的栈中,线程之间数据修改彼此互不影响。

由于存储的地址空间发生改变,空间中越往上地址越大,所以我们读取的地址理所当然的变大了。

🚩对Linux线程简单的封装

代码如下:

代码语言:javascript
复制
#pragma once

#include <iostream>
#include <string>
#include <cstring>
#include <cassert>
#include <functional>
#include  <pthread.h>
// header only 开源代码

class Thread;

//上下文,当成一个大号的结构体
class Context
{
public:
    Thread *this_;
    void *args_;
public:
    Context():this_(nullptr), args_(nullptr)
    {}
    ~Context()
    {}
};

class Thread
{
public:
    // using func_t = std::function<void*(void*)>;
    typedef std::function<void*(void*)> func_t;
    const int num = 1024;
public:
    Thread(func_t func, void *args = nullptr, int number = 0): func_(func), args_(args)
    {
        // name_ = "thread-";
        // name_ += std::to_string(number);

        char buffer[num];
        snprintf(buffer, sizeof buffer, "thread-%d", number);
        name_ = buffer;

         // 异常 == if: 意料之外用异常或者if判断
        // assert: 意料之中用assert
        Context *ctx = new Context();
        ctx->this_ = this;
        ctx->args_ = args_;
        int n = pthread_create(&tid_, nullptr, start_routine, ctx); //TODO
        assert(n == 0); //编译debug的方式发布的时候存在,release方式发布,assert就不存在了,n就是一个定义了,但是没有被使用的变量
        // 在有些编译器下会有warning
        (void)n;
    }
    // 在类内创建线程,想让线程执行对应的方法,需要将方法设置成为static
    static void *start_routine(void *args) //类内成员,有缺省参数!
    {
        Context *ctx = static_cast<Context *>(args);
        void *ret = ctx->this_->run(ctx->args_);
        delete ctx;
        return ret;
        // 静态方法不能调用成员方法或者成员变量
    }

    void join()
    {
        int n = pthread_join(tid_, nullptr);
        assert(n == 0);
        (void)n;
    }

    void *run(void *args)
    {
        return func_(args);
    }

    ~Thread()
    {
        //do nothing
    }
private:
    std::string name_;
    func_t func_;
    void *args_;

    pthread_t tid_;
};

到这里,本篇内容就结束了,我们下期内容,再见!!。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2024-07-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 🚩多线程代码的健壮性
  • 🚩多线程控制
  • 🚩线程返回值问题
  • 🚩关于Linux线程库
  • 🚩对Linux线程简单的封装
相关产品与服务
数据保险箱
数据保险箱(Cloud Data Coffer Service,CDCS)为您提供更高安全系数的企业核心数据存储服务。您可以通过自定义过期天数的方法删除数据,避免误删带来的损害,还可以将数据跨地域存储,防止一些不可抗因素导致的数据丢失。数据保险箱支持通过控制台、API 等多样化方式快速简单接入,实现海量数据的存储管理。您可以使用数据保险箱对文件数据进行上传、下载,最终实现数据的安全存储和提取。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档