【Linux C | 多线程编程】线程的基础知识-编程知识

😁博客主页😁：🚀https://blog.csdn.net/wkd_007🚀
🤑博客内容🤑：🍭嵌入式开发、Linux、C语言、C++、数据结构、音视频🍭
🤣本文内容🤣：🍭介绍线程的基础知识 🍭
😎金句分享😎：🍭你不能选择最好的，但最好的会来选择你——泰戈尔🍭
⏰发布时间⏰：2024-03-16 13:03:47

本文未经允许，不得转发！！！

🎄一、什么是线程

在了解线程之前，先看看程序和进程是什么？

程序：程序或可执行文件是静态的静态的实体，只是一组指令的集合，没有执行的意义。

进程：是运行之后的程序，是一个动态的实体，有自己的生命周期。

线程：线程是一个进程内部的一个控制序列，是操作系统进程调度器可以调度的最小执行单元。一个进程运行之后，就至少会有一个线程。只有一个线程的进程叫单线程进程。

一个进程可能包含多个线程，传统意义上的进程，不过是多线程的一种特例，即该进程只包含一个线程。在Linux系统开发中，也经常会使用到多线程编程，把进程设计成在同一时刻能够做多件事，每个线程处理各自独立的任务。

在这里插入图片描述

🎄二、多线程的优缺点

✨2.1 多线程的优点

同一个进程的线程会共享内存地址空间。同一个进程的多个线程共享一份全局内存区域，包括初始化数据段、未初始化数据段和动态分配的堆内存段。这使得创建或终止线程的时间要少于进程，共享数据比进程简单。
发挥多核优势，充分利用CPU资源。如果存在多个相同的任务，彼此之间并行不悖，互不依赖（或者依赖性很小），那么启动多个线程并发处理，是一个不错的选择。通过为每种事件类型的处理分配单独的线程，能够简化处理异步时间的代码。
有些问题可以通过将其分解从而改善整个程序的吞吐量。
交互的程序可以通过使用多线程实现相应时间的改善，多线程可以把程序中处理用户输入输出的部分与其它部分分开。

✨2.2 多线程的缺点

多线程的进程，因地址空间的共享让该进程变得更加脆弱。多个线程之中，只要有一个线程不够健壮存在bug，就可能导致整个进程崩溃。
线程模型作为一种并发的编程模型，效率并没有想象的那么高，会出现复杂度高、易出错、难以测试和定位的问题。
多线程编程很难将全部任务均等地分给每个进程；
多线程之间可能存在依赖关系，一个线程未完成某些操作之前，其他线程不应该运行。
多线程编程存在四个陷进：死锁（Dead Lock）、饿死（Starvation）、活锁（Live Lock）、竞态条件（Race Condition）

在这里插入图片描述

🎄三、线程ID

在Linux中，目前的线程实现是Native POSIX Thread Library，简称NPTL。在这种实现下，线程又被称为轻量级进程（Light Weighted Process），每一个用户态的线程，在内核之中都对应一个调度实体，也拥有自己的进程描述符（task_struct结构体）。

对于单线程进程来说，一个进程对应内核里的一个进程描述符，对应一个进程ID。
多线程的进程，又被称为线程组，线程组内的每一个线程在内核之中都存在一个进程描述符（task_struct）与之对应。
struct task_struct {...pid_t pid;pid_t tgid;...struct task_struct *group_leader;...struct list_head thread_group;...
}
内核的 struct task_struct 结构体中的两个ID字段：
pid：pthread ID，表示线程ID；
tgid：意思是 Thread Group ID，表示线程组ID，对应的是进程ID。

✨3.1 gettid

Linux中提供系统调用 gettid 来获取调用者的线程ID。但是，这个系统调用没有glibc封装，使用glibc的编译器时只能使用 syscall 函数来调用 gettid 系统调用；

gettid函数原型：

#include <sys/types.h>
pid_t gettid(void);
Note: There is no glibc wrapper for this system call; see NOTES.

函数描述：gettid() 返回调用方的线程ID(TID)。在单线程进程中，线程ID等于进程ID(PID，由getpid()返回)。在多线程进程中，所有线程都有相同的PID，但每个线程都有一个唯一的TID。

✨3.2 syscall

因为在 glibc 的编译器没有gettid 函数，所以只能使用 syscall 函数来获取线程ID，syscall函数原型如下：

#define _GNU_SOURCE         /* See feature_test_macros(7) */
#include <unistd.h>
#include <sys/syscall.h>   /* For SYS_xxx definitions */
int syscall(int number, ...);

函数描述：syscall()是一个小型库函数，用于系统调用，该系统调用的汇编语言接口具有指定的数字和指定的参数。例如，当调用C库中没有包装函数的系统调用时，使用syscall()非常有用。

下面是一个例子，创建4个线程，分别获取自己的线程ID，例子中用到一些陌生的函数如：pthread_create，会在后面介绍线程的文章讲解。这个例子可以使用命令gcc gettid.c -lpthread 进行编译，-lpthread表示要链接线程库。

// gettid.c
#include <stdio.h>
#include <pthread.h>
#include <sys/syscall.h>
#include <unistd.h>void *func(void *arg)
{int *pI = arg;pid_t tid = /*getpid()*/syscall(SYS_gettid);printf("this thread is num %d , tid=%d\n", *pI, tid);while(1); // 避免线程退出return NULL;
}
int main()
{int i=0;int args[4] = {0,};for(i=0; i<4; i++){pthread_t threadId;args[i] = i;pthread_create(&threadId, NULL, func, &args[i]);}while(1); // 避免线程退出return 0;
}

运行结果：
在这里插入图片描述

✨3.3 查看线程ID

在Linux下，使用ps命令中的-L选项，会显示出线程的如下信息。

LWP：线程ID，即gettid（）系统调用的返回值。
NLWP：线程组内线程的个数

使用ps命令查看上面程序的线程，因为ps命令输出太多了，这里使用grep过滤一下，使用命令ps -eLf | grep -e "PID" -e "a.out"，只显示带有PID、a.out关键字的行，结果如下：
可以看到a.out有5个线程，主线程是PID和LWP列一样的线程，即113178那一行。
在这里插入图片描述
ps命令还可以使用-T选项来显示SPID列，表示线程ID。如果想知道更多的ps命令，可以使用ps --help查看。