Linux环境多线程编程基础设施

本文介绍多线程环境下并行编程的基础设施。主要包括：

Volatile
__thread
Memory Barrier
__sync_synchronize

volatile

编译器有时候为了优化性能，会将一些变量的值缓存到寄存器中，因此如果编译器发现该变量的值没有改变的话，将从寄存器里读出该值，这样可以避免内存访问。

但是这种做法有时候会有问题。如果该变量确实（以某种很难检测的方式）被修改呢？那岂不是读到错的值？是的。在多线程情况下，问题更为突出：当某个线程对一个内存单元进行修改后，其他线程如果从寄存器里读取该变量可能读到老值，未更新的值，错误的值，不新鲜的值。

如何防止这样错误的“优化”？方法就是给变量加上volatile修饰。

volatile int i=10;//用volatile修饰变量i......//something happened int b = i;//强制从内存中读取实时的i的值

OK，毕竟volatile不是完美的，它也在某种程度上限制了优化。有时候是不是有这样的需求：我要你立即实时读取数据的时候，你就访问内存，别优化；否则，你该优化还是优化你的。能做到吗？

不加volatile修饰，那么就做不到前面一点。加了volatile，后面这一方面就无从谈起，怎么办？伤脑筋。

其实我们可以这样：

int i = 2; //变量i还是不用加volatile修饰#define ACCESS_ONCE(x) (* (volatile typeof(x) *) &(x))

需要实时读取i的值时候，就调用ACCESS_ONCE(i)，否则直接使用i即可。

这个技巧，我是从《Is parallel programming hard？》上学到的。 IT网，http://www.it.net.cn

听起来都很好？然而险象环生：volatile常被误用，很多人往往不知道或者忽略它的两个特点：在C/C++语言里，volatile不保证原子性；使用volatile不应该对它有任何Memory Barrier的期待。 IT网，http://www.it.net.cn

第一点比较好理解，对于第二点，我们来看一个很经典的例子： IT网，http://www.it.net.cn

volatile int is_ready = 0;char message[123];void thread_A{ while(is_ready == 0) { } //use message;}void thread_B{ strcpy(message,"everything seems ok"); is_ready = 1;}

线程B中，虽然is_ready有volatile修饰，但是这里的volatile不提供任何Memory Barrier，因此12行和13行可能被乱序执行，is_ready = 1被执行，而message还未被正确设置，导致线程A读到错误的值。

这意味着，在多线程中使用volatile需要非常谨慎、小心。

__thread

__thread是gcc内置的用于多线程编程的基础设施。用__thread修饰的变量，每个线程都拥有一份实体，相互独立，互不干扰。举个例子：

#include #include #include using namespace std;__thread int i = 1;void* thread1(void* arg);void* thread2(void* arg);int main(){ pthread_t pthread1; pthread_t pthread2; pthread_create(&pthread1, NULL, thread1, NULL); pthread_create(&pthread2, NULL, thread2, NULL); pthread_join(pthread1, NULL); pthread_join(pthread2, NULL); return 0;}void* thread1(void* arg){ cout<<++i<<endl;//输出 2 return NULL;}void* thread2(void* arg){ sleep(1); //等待thread1完成更新 cout<<++i<<endl;//输出 2，而不是3 return NULL;}

需要注意的是：

1，__thread可以修饰全局变量、函数的静态变量，但是无法修饰函数的局部变量。

2，被__thread修饰的变量只能在编译期初始化，且只能通过常量表达式来初始化。

Memory Barrier

为了优化，现代编译器和CPU可能会乱序执行指令。例如：

int a = 1;int b = 2;a = b + 3;b = 10;

CPU乱序执行后，第4行语句和第5行语句的执行顺序可能变为先b=10然后再a=b+3

有些人可能会说，那结果不就不对了吗？b为10，a为13？可是正确结果应该是a为5啊。

哦，这里说的是语句的执行，对应的汇编指令不是简单的mov b,10和mov b,a+3。

生成的汇编代码可能是：

movl b(%rip), %eax ; 将b的值暂存入%eaxmovl $10, b(%rip) ; b = 10addl $3, %eax ; %eax加3movl %eax, a(%rip) ; 将%eax也就是b+3的值写入a,即 a = b + 3

这并不奇怪，为了优化性能，有时候确实可以这么做。但是在多线程并行编程中，有时候乱序就会出问题。

一个最典型的例子是用锁保护临界区。如果临界区的代码被拉到加锁前或者释放锁之后执行，那么将导致不明确的结果，往往让人不开心的结果。

还有，比如随意将读数据和写数据乱序，那么本来是先读后写，变成先写后读就导致后面读到了脏的数据。因此，Memory Barrier就是用来防止乱序执行的。具体说来，Memory Barrier包括三种：

1，acquire barrier。acquire barrier之后的指令不能也不会被拉到该acquire barrier之前执行。

2，release barrier。release barrier之前的指令不能也不会被拉到该release barrier之后执行。

3，full barrier。以上两种的合集。

所以，很容易知道，加锁，也就是lock对应acquire barrier；释放锁，也就是unlock对应release barrier。哦，那么full barrier呢？ IT网，http://www.it.net.cn

__sync_synchronize

__sync_synchronize就是一种full barrier。

阅读全文



请按住滑块，拖动到最右边



了解新功能

Linux下线程编程

Linux下线程编程

2022-08-24 15:42:45

1682

C语言线程池的实现方案

这是一个简单小巧的C语言线程池实现，在 Github 上有 1.1K 的 star，很适合用来学习 Linux 的多线程编程。

2023-01-29 16:43:31

1110

Linux多线程编程基础知识解析

线程是轻量级的进程(`LWP: Light Weight Process`)，在`Linux`环境下线程的本质仍是`进程`，进程是资源分配的`最小单位`，线程是操作系统调度执行的`最小单位`。

2023-07-14 16:41:43

450

Rust的多线程编程概念和使用方法

和字段、常见用法以及多线程的一些实践经验。由浅入深带你零基础玩转Rust的多线程编程。线程的基本概念和使用方法 Thread是Rust中并发编程的一种基本方式。Rust中的Thread使用标准

2023-09-20 11:15:51

407

Java多线程的用法

本文将介绍一下Java多线程的用法。基础介绍什么是多线程 指的是在一个进程中同时运行多个线程，每个线程都可以独立执行不同的任务或操作。与单线程相比，多线程可以提高程序的并发性和响应

2023-09-30 17:07:00

561

正在加载...

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

Linux环境多线程编程基础设施

volatile

__thread

Memory Barrier

__sync_synchronize

评论