在C++11之前,涉及到多线程问题,都是和平台相关的,比如windows和linux下各有自己的接口,这使得代码的可移植性比较差。
//在C++98标准下,实现可移植的多线程程序 —— 条件编译
#ifdef _WIN32CreateThread(); //在windows系统下,调用windows多线程接口//......
#elif __linux__pthread_create(); //在linux系统下,调用pthread线程库接口//......
#endif
C++11中最重要的特性就是对多线程编程进行了支持,而且还引入了原子操作和原子类。
- 使得C++在并行编程时不需要依赖第三方库,thread库底层使用条件编译封装各种平台的多线程接口,增加了C++代码的可移植性。
- 将多线程接口封装成了类,体现了面向对象的程序设计方法。
一、thread 线程库
注意:要使用C++11标准库中的多线程接口,必须包含< thread >
头文件。
1.1 成员函数介绍
thread线程对象可以关联一个线程,用来控制线程以及获取线程的状态。
thread类成员函数 | 对应的pthread库函数 | 函数功能 | 使用方法 |
---|---|---|---|
thread(); | —— | 构造一个线程对象,没有关联任何线程函数,即没有启动任何线程 | thread类的默认构造,并没有创建出子线程。 |
template <class Fn, class… Args> thread (Fn&& fn, Args&&… args); | pthread_create(); | 构造一个线程对象,并关联线程函数fn;args1,args2,…为线程函数的参数 | 万能应用和可变参数模板:线程函数fn可以传函数指针,函数对象,lambda表达式;线程函数的参数可以传任意类型,任意数量。 |
get_id(); | pthread_self(); | 获取线程id | get_id的返回值是自定义类型thread::id,id类重载了所有的关系运算符和流插入运算符(<<),用于比较和输出线程id。如果不想通过thread类成员函数获取线程id,可以调用全局函数this_thread::get_id() |
join(); | pthread_join(); | 阻塞等待子线程 | —— |
joinable(); | —— | 检查线程是否可以被join:如果线程已经被join或者已经被detach,则该函数返回false,否则返回true。 | 如果该函数返回true,那么我们可以安全地调用join()函数来等待线程结束。如果该函数返回false,那么我们应该避免调用join()函数,否则会导致程序崩溃。 |
detach(); | pthread_detach(); | 分离子线程,它的资源将在线程结束时自动释放,无需其他线程调用join 函数来等待它的结束。 | —— |
线程对象的创建
当创建一个线程对象后,没有提供线程函数,该对象实际没有对应任何线程。
当创建一个线程对象后,并且给线程关联线程函数,该线程就被启动,与主线程一起运行。
线程函数一般情况下可按照以下三种方式提供:
- 函数指针
- lambda表达式
- 函数对象
线程对象的移动
thread类是防拷贝的,不允许拷贝构造以及拷贝赋值,因为拷贝线程是没有实际意义的。但是可以移动构造和移动赋值,即将一个线程对象关联线程的状态转移给其他线程对象,转移期间不影响线程的执行。
移动构造和移动赋值的意义:分离线程的创建和启动,可以先使用默认构造创建一个空线程对象,再在合适的时候使用移动赋值关联线程函数,启动线程。
测试程序:
// 创建多个线程求1~n的和:
int main()
{int m = 0;cin >> m;创建一个空线程对象vector<thread> vthds(m); // 调用thread类的默认构造,创建m个空线程对象vector<int> nums(m, 0);for (auto &e : nums){cin >> e;}for (int i = 0; i < m; ++i){// 调用thread类的移动赋值关联线程函数,启动线程// 这里用lambda表达式充当线程函数vthds[i] = thread([](int num){int sum = 0;for(int j = 1; j <= num; ++j){sum += j;} //调用全局函数this_thread::get_id获取线程idcout << "[" << this_thread::get_id() << "]: " << sum << endl; }, nums[i]); }for (auto &t : vthds) // thread类禁用拷贝构造,所以必须加引用{t.join();}
}
运行结果:
判断线程对象是否有效
可以通过jionable()函数判断线程是否是有效的,如果是以下任意情况,则线程无效
- 采用无参构造函数构造的线程对象
- 线程对象的状态已经转移给其他线程对象
- 线程已经调用jion或者detach结束
1.2 线程函数参数
线程函数的参数是以值拷贝的方式拷贝到线程栈空间中的,因此:即使线程参数为引用类型,在线程中修改后也不能修改外部实参,因为其实际引用的是线程栈中的拷贝,而不是外部实参。
// 线程函数的参数
#include <thread>int k = 0;void ThreadFunc1(int *x)
{*x += 10;
}void ThreadFunc2(int &x)
{x += 10;
}class A
{
public:int i = 10;static void ThreadFunc3(){k += 10;}void ThreadFunc4(){i += 101;}
};int main()
{// 线程函数的参数可以传外部变量的地址(将地址拷贝到线程独立栈)thread t1(ThreadFunc1, &k);t1.join();cout << k << endl;// 线程函数的参数不能直接传外部变量的引用(实际引用的是线程栈中的拷贝)// thread t2(ThreadFunc2, k); // 在线程函数中对k修改,不会影响外部实参,有些编译器可能直接编译报错thread t2(ThreadFunc2, std::ref(k)); // 如果想要通过形参改变外部实参,必须借助std::ref()函数传引用t2.join();cout << k << endl;// 静态成员函数和普通函数类似,只是需要注明类域thread t3(A::ThreadFunc3); // 取静态成员函数的地址可以不加&t3.join();cout << k << endl;// 非静态成员函数作线程函数时,必须将this指针(调用对象的地址)作为线程函数的参数。A a;thread t4(&A::ThreadFunc4, &a); // 取非静态成员函数的地址必须加&t4.join();cout << a.i << endl;return 0;
}
运行结果:
std::ref()函数模板,用于保存变量的引用
1.3 this_thread 命名空间
this_thread是一个访问当前线程的函数集合
-
get_id
:返回当前线程的线程ID -
sleep_until
:该线程休眠到某个时间点(绝对时间)参数:chrono::time_point类模板的实例化类型
用法:sleep_until - C++ Reference (cplusplus.com)
-
sleep_for
:该线程休眠持续某个时间段(相对时间)参数:chrono::duration类模板的实例化类型
用法:
std::this_thread::sleep_for (std::chrono::seconds(1)); // 调用线程休眠1秒
提示:chrono既是头文件,又是命名空间
-
yield
:主动出让线程的时间片
二、mutex 互斥锁库
2.1 4个互斥量类型
在C++11中,Mutex总共包了四个互斥量的种类:
- std::mutex
C++11提供的最基本的互斥量,该类的对象之间不能拷贝,也不能进行移动。mutex最常用的三个函数:
// mutex
int main()
{mutex mtx;int x = 0;int n = 100000;auto threadfunc = [&, n](){mtx.lock();for (int i = 0; i < n; ++i){++x;}mtx.unlock();};thread t1(threadfunc);thread t2(threadfunc);t1.join();t2.join();cout << x << endl;return 0;
}
注意,线程函数调用lock()时,可能会发生以下三种情况:
-
如果该互斥量当前没有被锁住,则调用线程将该互斥量锁住,直到调用 unlock之前,该线程一直拥有该锁
-
如果当前互斥量被其他线程锁住,则当前的调用线程被阻塞住
-
如果当前互斥量被当前调用线程锁住,则会产生死锁(deadlock)
线程函数调用try_lock()时,可能会发生以下三种情况:
- 如果当前互斥量没有被其他线程占有,则该线程锁住互斥量,直到该线程调用 unlock释放互斥量
- 如果当前互斥量被其他线程锁住,则当前调用线程返回 false,而并不会被阻塞掉
- 如果当前互斥量被当前调用线程锁住,则会产生死锁(deadlock)
- std::recursive_mutex
其允许同一个线程对互斥量多次上锁(即递归上锁),来获得对互斥量对象的多层所有权,释放互斥量时需要调用与该锁层次深度相同次数的 unlock(),除此之外,std::recursive_mutex 的特性和 std::mutex 大致相同。
测试程序:
// recursize_mutex
int x = 0;void threadfunc(int n, recursive_mutex *mtx)
{if(n == 0)return;mtx->lock();++x;threadfunc(n-1, mtx); //允许同一个线程对互斥量多次上锁(即递归上锁)mtx->unlock(); //释放互斥量时需要调用与该锁层次深度相同次数的 unlock()
}int main()
{recursive_mutex mtx; //定义一个递归互斥锁thread t1(threadfunc, 100000, &mtx);thread t2(threadfunc, 200000, &mtx);t1.join();t2.join();cout << x << endl;return 0;
}
- std::timed_mutex
比 std::mutex 多了两个成员函数,try_lock_for(),try_lock_until() 。
- try_lock_for()
接受一个时间范围,表示在这一段时间范围之内线程如果没有获得锁则被阻塞住(与std::mutex 的 try_lock() 不同,try_lock 如果被调用时没有获得锁则直接返回false),如果在此期间其他线程释放了锁,则该线程可以获得对互斥量的锁,如果超时(即在指定时间内还是没有获得锁),则返回 false。 - try_lock_until()
接受一个时间点作为参数,在指定时间点未到来之前线程如果没有获得锁则被阻塞住,如果在此期间其他线程释放了锁,则该线程可以获得对互斥量的锁,如果超时(即在指定时间内还是没有获得锁),则返回 false。
-
std::recursive_timed_mutex
结合recursive_mutex和timed_mutex的特点,不做介绍。
2.2 lock_guard
手动加锁,解锁的缺陷:锁控制不好时,可能会造成死锁,最常见的比如在锁中间代码返回,或者在锁的范围内抛异常。因此:C++11采用RAII的方式对锁进行了封装,即lock_guard和unique_lock。
std::lock_gurad 是 C++11 中定义的模板类。定义如下:
template<class _Mutex>
class lock_guard
{
public:// 在构造lock_gard时加锁explicit lock_guard(_Mutex& _Mtx): _MyMutex(_Mtx){_MyMutex.lock();}// 在构造lock_gard时,_Mtx已经被上锁,此处不需要再上锁lock_guard(_Mutex& _Mtx, adopt_lock_t): _MyMutex(_Mtx){}// 在析构lock_guard时解锁~lock_guard() _NOEXCEPT{_MyMutex.unlock();}// lock_guard不允许拷贝lock_guard(const lock_guard&) = delete;lock_guard& operator=(const lock_guard&) = delete;
private:_Mutex& _MyMutex; //注意:互斥锁不支持拷贝,所以成员变量是互斥锁的引用
};
- 通过上述代码可以看到,lock_guard类模板主要是通过RAII的方式,对其管理的互斥量进行了封装,在需要加锁的地方,只需要用上述介绍的任意互斥体实例化一个lock_guard,调用构造函数成功上锁,出作用域前,lock_guard对象要被销毁,调用析构函数自动解锁,可以有效避免死锁问题。
- lock_guard的缺陷:太单一,用户没有办法对该锁进行控制,因此C++11又提供了unique_lock。
2.3 unique_lock
与lock_gard类似,unique_lock类模板也是采用RAII的方式对锁进行了封装,并且也是以独占所有权的方式管理mutex对象的上锁和解锁操作,即其对象之间不能发生拷贝。
在构造(或移动(move)赋值)时,unique_lock 对象需要传递一个 Mutex 对象作为它的参数,新创建的unique_lock 对象负责传入的 Mutex 对象的上锁和解锁操作。使用以上类型互斥量实例化unique_lock的对象时,自动调用构造函数上锁,unique_lock对象销毁时自动调用析构函数解锁,可以很方便的防止死锁问题。
// lock_guard && unique_lock
int x = 0;
mutex mtx;void threadfunc(int n)
{for (int i = 0; i < n; ++i){try{// mtx.lock();// lock_guard和unique_lock会在构造时加锁,析构时解锁// lock_guard<mutex> lock(mtx);unique_lock<mutex> lock(mtx);++x;// 抛异常,会跳过unlock函数使程序不能继续执行if (rand() % 3 == 0){throw exception();}// mtx.unlock();}catch (const exception &e){cerr << "抛异常" << endl;}};
}int main()
{srand((unsigned int)time(nullptr));thread t1(threadfunc, 10);thread t2(threadfunc, 20);t1.join();t2.join();cout << x << endl;return 0;
}
与lock_guard不同的是,unique_lock更加的灵活,提供了更多的成员函数:
- 上锁/解锁操作:lock、try_lock、try_lock_for、try_lock_until和unlock
- 修改操作:移动赋值、交换(swap:与另一个unique_lock对象互换所管理的互斥量所有权)、释放(release:返回它所管理的互斥量对象的指针,并释放所有权)
- 获取属性:owns_lock(返回当前对象是否上了锁)、operator bool()(与owns_lock()的功能相同)、mutex(返回当前unique_lock所管理的互斥量的指针)。
三、condition_variable 条件变量库
本节主要演示了condition_variable的使用,condition_variable熟悉我们linux课程已经讲过了,他们用来进行线程之间的互相通知。condition_variable和Linux posix的条件变量并没有什么大的区别,主要还是面向对象实现的。
测试程序:
// 1~100,t1打印奇数,t2打印偶数
int main()
{mutex mtx;int x = 1;int n = 12345;// 1个共享资源,相同条件(奇或偶),定义1个条件变量condition_variable cv;// 创建并启动2个子线程thread t1([&, n](){while (x<=n){unique_lock<mutex> lock(mtx);// if(x > n) break; // 错误// wait参数:unique_lock, 通关条件cv.wait(lock, [&x](){return x%2 == 1;});// 等效的实现方法:// while (!(x % 2 == 1)) // 防止伪唤醒// {// cv.wait(lock);// }if(x > n) break; // 条件判断必须放在wait之后cout << "[t1]" << ":" << x << endl;++x;cv.notify_one();} });thread t2([&, n](){while(x<=n){unique_lock<mutex> lock(mtx);cv.wait(lock, [&x](){return x%2 == 0;});// 等效的实现方法:// while(!(x%2 == 0)) // 阻塞条件// {// cv.wait(lock);// }if(x > n) break;cout << "[t2]" << ":" << x << endl;++x;cv.notify_one();} });t1.join();t2.join();return 0;
}
运行结果:
如何确定条件变量的数量?
对于确定条件变量的数量,一般是根据要控制的共享资源或者线程的数量来确定的。如果有多个共享资源或者多个线程需要等待不同的条件来执行,就需要相应数量的条件变量。
如果要控制多个线程对同一个共享资源的访问,可以使用一个条件变量来控制所有线程的等待和唤醒。如果需要不同的条件来控制不同的线程,就需要针对不同的条件使用不同的条件变量。
总结:1个共享资源 + 相同条件 = 1个条件变量
四、atomic 原子操作库
多线程最主要的问题是共享数据带来的问题(即线程安全)。如果共享数据都是只读的,那么没问题,因为只读操作不会影响到数据,更不会涉及对数据的修改,所以所有线程都会获得同样的数据。但是,当一个或多个线程要修改共享数据时,就会产生很多潜在的麻烦。
对此,C++98中传统的解决方式:可以对共享修改的数据可以加锁保护。虽然加锁可以解决,但是加锁有一个缺陷就是:临界区代码必须串行执行,只要一个线程在执行临界区代码时,其他线程就会被阻塞,会影响程序运行的效率,而且锁如果控制不好,还容易造成死锁。
因此C++11中引入了原子操作(CAS)。所谓原子操作:即不可被中断的一个或一系列操作,C++11引入的原子操作类型,使得线程间数据的同步变得非常高效。
4.1 atomic库中的内置原子类型
在C++11中,程序员不需要对原子类型变量进行加锁解锁操作,线程能够对原子类型变量互斥的访问。
#include <iostream>
using namespace std;
#include <thread>
#include <atomic>atomic_long sum{ 0 }; //定义原子类型void fun(size_t num)
{for (size_t i = 0; i < num; ++i)sum ++; // 原子操作,不需要进行加锁解锁操作
}int main()
{cout << "Before joining, sum = " << sum << std::endl;thread t1(fun, 1000000);thread t2(fun, 1000000);t1.join();t2.join();cout << "After joining, sum = " << sum << std::endl;return 0;
}
atomic库中的内置原子类型实际上是atomic类模板的实例化类型。
注意:需要使用以上原子操作变量时,必须添加头文件<atomic>
4.2 atomic类模板
更为普遍的,程序员可以使用atomic类模板,定义出需要的任意原子类型。
注意:原子类型通常属于"资源型"数据,多个线程只能访问单个原子类型的拷贝,因此在C++11中,原子类型只能从其模板参数中进行构造,不允许原子类型进行拷贝构造、移动构造以及operator=等,为了防止意外,标准库已经将atmoic模板类中的拷贝构造、移动构造、赋值运算符重载默认删除掉了。
#include <atomic>
int main()
{atomic<int> a1(0);//atomic<int> a2(a1); // 编译失败atomic<int> a2(0);//a2 = a1; // 编译失败return 0;
}
4.3 原子操作的原理及应用
CAS(Compare and Swap)操作是一种原子操作,用于实现并发控制。它的原理是:
- 读取共享变量的值。
- 比较共享变量的值与期望值是否相等,如果相等则执行第4步,否则执行第3步。
- 放弃操作,重新读取共享变量的值,然后再次比较。
- 将新值写入共享变量。
CAS操作的关键在于比较共享变量的值与期望值是否相等,如果相等则说明共享变量没有被其他线程修改,可以执行写入操作。如果不相等则说明共享变量已经被其他线程修改,需要重新读取共享变量的值并再次比较。这样就可以保证对共享变量的操作是原子的,避免了并发问题。
详细内容请阅读陈浩老师的文章:无锁队列的实现 {CAS操作的原理,无锁队列的链表实现,CAS的ABA问题,无锁队列的数组实现}-CSDN博客
4.4 加锁 VS 原子操作
加锁和原子操作都是用于处理多线程并发访问共享资源的工具,它们各自有一些优势和适用场景。
加锁的优点:
- 灵活性:锁提供了更灵活的线程同步机制,可以精确控制临界区的范围,避免不必要的同步。
- 可以实现复杂的线程同步逻辑:锁可以实现复杂的线程同步逻辑,比如读写锁、重入锁等,满足不同场景下的需求。
- 可以避免ABA问题:在一些情况下,锁能够避免CAS操作中可能出现的ABA问题。
原子操作的优点:
- 性能:原子操作通常比加锁的方式具有更好的性能,因为它们通常使用底层硬件指令或者CAS操作来实现,避免了线程阻塞和用户态内核态切换的开销。
- 简单性:原子操作通常比加锁的方式更简单,使用起来更加方便,不容易出现死锁等问题。
- 可见性:原子操作通常能够保证操作的可见性,确保对共享变量的操作对其他线程是可见的。
在实际应用中,应根据具体的需求和场景来选择使用加锁还是原子操作。通常情况下,如果需要实现简单的原子操作,比如自增、自减等操作,原子操作是更好的选择;而如果需要复杂的线程同步逻辑或者需要精确控制临界区的范围,加锁是更合适的选择。