并发-并发挑战及底层实现原理笔记

并发编程挑战

上下文切换

  • cpu通过给每个线程分配cpu时间片实现多线程执行,时间片是cpu分配给各个线程的时间,cpu通过不断切换线程执行。
  • 线程有创建和上下文切换的开销。
  • 减少上下文切换的方方法
    – 无锁并发编程,eg:将数据的id按照hash算法取模分段,不同线程处理不同段的数据
    – cas算法:java的atomic包使用cas算法来更新数据,不需要加锁
    – 使用最少的线程:
    – 协程:在单线程里实现多任务的调度,并在单线程里维持了多个任务间的切换

死锁

避免死锁的方法

  • 避免一个线程同时获取多个锁
  • 避免一个线程在锁内同时占用多个资源,尽量保证每个锁只占用一个资源
  • 尝试使用定时锁,使用lock.tryLock(timeout)来替代使用内部锁机制
  • 对于数据库锁,加锁和解锁必须在一个数据库连接里,否则出现解锁失败的情况

资源限制的挑战

资源限制

在进行并发编程时,程序的执行速度受限于计算机硬件资源或软件资源

引起的问题

串行代码变成并发执行时,如果受限于资源,仍然串行执行,不仅不会快反而会更慢,增加了上下文切换和资源调度的时间。
例如:使用多线程在办公网并发地下载和处理数据时,导致cpu利用率达到100%,几个小时都不能运行完成任务,后来修改成单线程,一个小时就执行完成了。

解决方法

  • 硬件资源:考虑集群并行执行程序
  • 软件资源:使用资源池将资源复用

资源限制情况下进行并发编程

将不同的资源限制调整程序的并发度

并发机制的底层实现原理

  • java代码编译后会编程java字节码
  • 字节码被类加载器加载到jvm里,jvm执行字节码,
  • 最终转为汇编指令在cpu上执行

volatile应用

  • 轻量级
  • 保证共享变量的可见性
    • 可见性:当一个线程修改一个共享变量时,另外一个线程能读到这个修改的值。

实现原理

如果一个字段被声明成了volatile,java线程内存模型确保所有线程看到这个变量的值是一致的。

cpu术语
  • 内存屏障:实现对内存操作的顺序限制
  • 缓冲行:缓存中可以分配的最小存储单位
  • 原子操作:不可中断的一个或一系列操作
  • 缓存行填充:当处理器识别到从内存中读取操作数是可缓存的,处理器读取整个缓存行到适当的缓存
  • 缓存命中
  • 写命中
  • 写缺失

Java代码

instance = new Singleton() ;//instance是volatile变量

转成汇编代码

0x01a3de1d:movb $0x0,0x1104800(%esi);0x01a3de24:lock add1 $0x0,(%esp);

Lock前缀的指令在多核处理器引发两件事情

  • 将当前处理器缓存行的数据写回到系统内存
  • 写回内存的操作会使其他cpu里缓存了该内存地址的数据无效

过程

  • 处理器先将系统内存的数据读到内存缓存后再操作
  • 对声明了volatile的变量进行写操作,jvm会向处理器发送一条lock前缀指令,将这个变量所在缓存行的数据协会到系统内存
  • 多处理器下,实现缓存一致性,每个处理器通过嗅探在总线上传播的数据来检查自己缓存的值是不是过期了
  • 处理器发现自己缓存行对应的内存地址被修改,就会将当前处理器缓存行设置成无效状态,当对数据修改操作会重新从内存中把数据读到处理器缓存中。

volatile两条实现原则

  • 缓存锁定:Lock前缀指令会引起处理器缓存会写到内存,Lock#信号一般不锁总线,锁内存。缓存一致性机制会阻止同时修改由两个以上处理器缓存的内存区域数据。
  • 一个处理器的缓存回写到内存会导致其他处理器的缓存无效:处理器使用嗅探技术保证他的内存缓存,系统内存和其他处理器的缓存数据在总线上保持一致。
使用优化

jdk7 并发包中新增了一个队列集合类Linked-TransferQueue,在使用volatile时,用一种追加字节的方式来优化队列出队和入队的性能。

  • LinkedTransferQueue结构

    • 内部类型定义队列的头节点和尾节点
    • 内部类PaddedAtomicReference
  • 追加字节能优化队列出队和入队性能:内部类PaddedAtomicReference相对于父类AtomicReference多了将共享变量追加到64字节(15个变量+父类valule变量)

  • 为什么提高并发编程效率:有些处理器的l1,l2或l3缓存的高速缓存行使64字节宽。追加到64字节填满高速缓冲区的缓存行,避免了头结点和为节点加载到同一个缓存行,使头尾节点在修改时不会互相锁定。

  • 不能使用追加64场景

    • 缓存行非64字节的处理器:eg:P6系列和奔腾处理器,是32字节
    • 共享变量不会被频繁地写

synchronized

synchronized实现同步的基础:Java中的每个对象都可以作为锁

  • 普通同步方法,锁是当前实例对象
  • 静态同步方法,锁是当前类的class对象
  • 同步方法块,锁是synchronized括号里配置的对象

Monitor指令

  • monitorenter指令是在编译后插入到同步代码块的开始位置
  • monitorexit是插入到方法结束处和异常处
  • 任何对象都有一个monitor与之关联,当且一个monitor被持有后,处于锁定状态。
  • 线程执行到monitorenter指令时,将会尝试获取对象对应的monitor所有权,尝试获取对象的锁。

java对象头

synchronized用的锁是存在java对象头里的,如果对象是数组类型,虚拟机用3个字宽存储对象头,如果对象是非数组类型,用2字宽存储对象头。

  • Mark World:存储对象的hashCode,分代年龄和锁标记位

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-oshe1Pci-1692516244748)(C:\Users\DELL\AppData\Roaming\Typora\typora-user-images\image-20230820120519714.png)]

  • Class Metadata Address:存储到对象类型数据的指针

  • Array length:数组的长度(如果当前对象是数组)

锁的升级与对比

  • 锁状态:无锁状态,偏向锁状态,轻量级锁状态,重量级锁状态
  • 锁可以升级但不能降级,目的是为了提高获得锁和释放锁的效率
偏向锁

多数情况下,锁不仅不存在多线程竞争,而且总是由同一个线程多次获得。

**偏向锁撤销:**等到竞争出现才释放锁的机制,当其他线程尝试竞争偏向锁时,持有偏向锁的线程才会释放锁。

  • 无锁:thread1 访问同步块,检查对象头中是否存储了thread1,没有,cas方法替换mark word
  • 偏向锁:成功。将对象头mark word中的线程id指向自己,执行同步体
  • 偏向锁:同时 thread2访问同步块,检查对象头是否存储了thread2,没有,cas替换mark word,不成功,撤销偏向锁
  • 偏向锁撤销:thread1暂停线程,解锁,将线程id设为空,恢复线程

关闭偏向锁

java6和java7中默认启用,但在应用程序启动几秒之后才激活

关闭延迟:-XX:BiasedLockingStartupDelay=0

关闭偏向锁:-XX:-UseBiasedLocking=false

轻量级锁

加锁

  • 线程执行同步块之前,jvm先在当前线程的栈帧中创建用于存储锁记录的空间
  • 将对象头中的mark word复制到锁记录中,
  • 线程尝试使用cas将对象头中的mark word替换为指向锁记录的指针
    • 成功:当前线程获取锁
    • 失败:其他线程竞争锁,当前线程尝试自旋获取锁

解锁

  • cas将displaced mark word 替换回对象头
    • 成功:表示没有竞争发生
    • 失败:当前锁存在竞争,膨胀成重量级锁

轻量级锁膨胀流程

  • 无锁:thread1 和thread2 访问同步块,分配空间并复制mark word 到栈。
  • 轻量级锁:thread1 和thread2 进行cas修改mark word
    • thread1 成功,将mark word替换为轻量级锁,执行同步体
    • thread2 失败,因为thread1获取了锁,thread3自选获取锁
  • 升级为重量级锁:
    • thread2 锁膨胀,修改为重量级锁,线程阻塞
    • thread1 cas替换mark word 失败,因为thread2在争夺锁,thread1释放锁并唤醒等待的线程。
    • thread2线程被唤醒,重新争夺锁访问同步块

当锁处于重量级,其他线程试图获取锁时,会被阻塞,当持有锁的线程释放锁后会唤醒这些线程,被唤醒的线程会进行新一轮的夺锁之争。

优缺点对比

  • 偏向锁
    • 优点:加锁解锁不需额外消耗
    • 缺点:如果线程间存在锁竞争,会带来额外撤销的消耗
    • 场景:适用于只有一个线程访问同步块的场景
  • 轻量级锁
    • 优点:竞争线程不会阻塞,提高响应速度
    • 缺点:如果始终得不到锁竞争的线程,使用自旋会消耗cpu
    • 场景:追求响应时间,同步块执行速度非常快
  • 重量级锁
    • 优点:线程竞争不使用自旋转,不消化cpu
    • 缺点:线程阻塞,响应时间缓慢
    • 场景:追求吞吐量,同步执行速度较长

原子操作的实现原理

术语

  • 缓存行:缓存的最小操作单位
  • 比较并替换(cas):比较旧值是否发生变化,交换成新值,否则不交换
  • cpu流水线:一条x86指令分成56步后有56个不同电路单元分别执行,实现在一个cpu时钟周期完成一条指令。
  • 内存顺序冲突:假共享引起,假共享指多个cpu同时修改同一个缓存行的不同部分引起其中一个cpu的操作无效,当出现这个内存顺序冲突时,cpu需清空流水线

处理器如何实现原子操作

基于对缓存加锁或总线加锁方式实现多处理器之间的原子操作

使用总线锁保证原子性

使用处理器提供的Lock#信号,当一个处理器在总线上输出此信号时,其他处理器的请求将被阻塞住,那么该处理器可以独占共享内存。

总线锁把cpu和内存之间的通信锁住了,其他处理器不能操作其他内存地址的数据,总线锁定的开销比较大。

使用缓存锁保证原子性
  • 频繁使用的内存会缓存在处理器L1,L2和L3高速缓存里。
  • 缓存锁定:内存区域如果被缓存在处理器的缓存行中,并且在Lock操作锁定期间被锁定,那么当他执行锁操作会写到内存时,处理器不在总线上声言LOCK#信号,而是修改内部的内存地址,并允许它的缓存一致性机制来保证操作的原子性。
  • 缓存一致性机制会阻止同时修改由两个以上处理器缓存的内存区域数据,当其他处理器回写已被锁定的缓存行数据时,会使缓存行无效。
  • 不能使用缓存锁定的情况
    • 当操作的数据不能被缓存在处理器内部,或操作的数据跨多个缓存行时,则处理器会调用总线锁定
    • 有些处理器不支持缓存锁定,对于Intel486和Pentium处理器,就算锁定的内存区域在处理器的缓存行中也会调用总线锁定。

java实现原子操作

使用cas实现原子操作
import java.util.ArrayList;
import java.util.List;
import java.util.concurrent.atomic.AtomicInteger;public class Counter {private AtomicInteger atomicInteger = new AtomicInteger(0);private int i = 0;public static void main(String[] args) {final Counter cas = new Counter();List<Thread> ts = new ArrayList<Thread>(600);long start = System.currentTimeMillis();for (int j = 0; j < 100; j++) {Thread thread = new Thread(new Runnable() {public void run() {for (int i = 0; i < 10000; i++) {cas.count();cas.safeCount();}}});ts.add(thread);}for (Thread t : ts) {t.start();}//等待所有线程执行完成for (Thread t : ts) {try {t.join();} catch (InterruptedException e) {e.printStackTrace();}}System.out.println(cas.i);System.out.println(cas.atomicInteger.get());System.out.println(System.currentTimeMillis()-start);}private void safeCount(){for (;;){int i = atomicInteger.get();boolean b = atomicInteger.compareAndSet(i, ++i);if(b){break;}}}private void count(){i++;}
}

执行结果:
在这里插入图片描述

java1.5,jdk提供了一些类支持原子操作:AtomicBoolean,AtomicInteger和AtomicLong

cas三大问题

java并发包中有些并发框架使用了自旋cas方式实现原子操作。

  • ABA
    • 问题:旧值由A变成B再变成A,最终值没变,但实际发生了变化
    • 解决:变量前增加版本号
    • Atomic包中AtomicStampedReference解决ABA问题
      • 先检查当前引用是否等于预期引用,
      • 检查当前标志是否等于预期标志
      • 全部相等更新值
  • 循环时间长开销大:自旋cas长时间不成功,cpu带来非常大的执行开销
    • jvm支持处理器提供的pause指令,效率提升作用
      • 可以延迟流水线执行指令,是cpu不会消耗过多的执行资源,延迟时间取决于具体实现版本
      • 避免在退出循环时因内存顺序冲突,引起cpu流水线被清空,提高执行效率
  • 只能保证一个共享变量原子操作
    • 对多个共享变量操作时,不能保证原子性,可以用锁,或者多个共享变量合成一个共享变量。
    • AtomicReference类保证引用对象之间的原子性,可以把多个变量放到一个对象里进行cas操作
使用锁机制实现原子操作
  • 锁机制保证了只有获得锁的线程能操作锁定的内存区域
  • 偏向锁,轻量锁,互斥锁,除了偏向锁,jvm实现锁的方式都用了循环cas
    • 当一个线程想进入同步块时,使用循环cas的方式来获取锁,当退出同步块的时候使用循环cas释放锁。

参考:Java并发编程的艺术

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/83932.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ubuntu学习(四)----文件写入操作编程

1、write函数的详解 ssize_t write(int fd,const void*buf,size_t count); 参数说明&#xff1a; fd:是文件描述符&#xff08;write所对应的是写&#xff0c;即就是1&#xff09; buf:通常是一个字符串&#xff0c;需要写入的字符串 count&#xff1a;是每次写入的字节数…

Linux线程 --- 生产者消费者模型(C语言)

在学习完线程相关的概念之后&#xff0c;本节来认识一下Linux多线程相关的一个重要模型----“ 生产者消费者模型” 本文参考&#xff1a; Linux多线程生产者与消费者_红娃子的博客-CSDN博客 Linux多线程——生产者消费者模型_linux多线程生产者与消费者_两片空白的博客-CSDN博客…

pytestx重新定义接口框架设计

概览 脚手架&#xff1a; 目录&#xff1a; 用例代码&#xff1a; """ 测试登录到下单流程&#xff0c;需要先启动后端服务 """test_data {"查询SKU": {"skuName": "电子书"},"添加购物车": {"sk…

一篇文章带你彻底了解Java常用的设计模式

文章目录 前言1. 工厂模式使用示例代码优势 2. 单例模式说明使用示例代码优势 3. 原型模式使用示例代码优势 4. 适配器模式使用示例代码优势 5. 观察者模式使用示例代码优势 6. 策略模式使用示例代码优势 7. 装饰者模式使用示例代码优势 8. 模板方法模式使用示例代码优势 总结 …

网络学生用品商店系统设计与实现(论文+源码)_kaic

摘 要 随着互联网的发展&#xff0c;人们的生活发生了巨大的变化&#xff0c;给人们的生活、工作等方面带来了相当大的提高&#xff0c;电子化成为了节约成本、调高效率的代名词。电子商务是利用微电脑技术和网络通讯技术进行的商务活动&#xff0c;买卖双方通过网络所进行各…

Windows商店引入SUSE Linux Enterprise Server和openSUSE Leap

在上个月的Build 2017开发者大会上&#xff0c;微软宣布将SUSE&#xff0c;Ubuntu和Fedora引入Windows 商店&#xff0c;反应出微软对开放源码社区的更多承诺。 该公司去年以铂金会员身份加入Linux基金会。现在&#xff0c;微软针对内测者的Windows商店已经开始提供 部分Linux发…

_数字矩阵

题目&#xff1a;一个3阶的数字矩阵如下&#xff1a; 1 2 3 8 9 4 7 6 5 现在给定数字n(1<n≤20)&#xff0c;输出n阶数字矩阵。 思路&#xff1a; 放出一条好玩的贪吃蛇&#xff0c;按照右下左上的顺序吃蛋糕&#xff0c;一边吃蛋糕&#xff0c;一边拉数字&#xff1b…

提升团队效率!探索多款热门一站式团队协作工具

“常见的几种团队协作工具有&#xff1a;Zoho Projects、Slack、Microsoft Teams、Asana、Trello等。” 团队协作已经成为了企业、组织和个人工作的重要组成部分。为了提高工作效率和协同能力&#xff0c;各种团队协作工具应运而生。本文将介绍团队协作工具的功能以及常见的几种…

LeetCode——有效的括号

这里&#xff0c;我提供一种用栈来解决的方法&#xff1a; 思路&#xff1a;栈的结构是先进后出&#xff0c;这样我们就可以模拟栈结构了&#xff0c;如果是‘&#xff08;’、‘{’、‘[’任何一种&#xff0c;直接push进栈就可以了&#xff0c;如果是‘}’、‘&#xff09;’…

vue3将通用组件注册成全局组件

一、问题重现 我们用过vue的人都知道会有一个components文件夹用来存放我们的通用组件&#xff1a; 这里我的通用组件就有四个&#xff0c;但是有一些是使用评率比较高的&#xff0c;如果很多地方要使用我还得导入相同的组件&#xff0c;写的都是一样的代码&#xff1a; impo…

wireshark进行网络监听

一、实验目的&#xff1a; 1&#xff09;掌握使用CCProxy配置代理服务器&#xff1b; 2&#xff09;掌握使用wireshark抓取数据包&#xff1b; 3&#xff09;能够对数据包进行简单的分析。 二、预备知识&#xff1a; 包括监听模式、代理服务器、中间人攻击等知识点&#xf…

研磨设计模式day09原型模式

目录 场景 代码实现 有何问题 解决方案 代码改造 模式讲解 原型与new 原型实例与克隆出来的实例 浅度克隆和深度克隆 原型模式的优缺点 思考 何时选用&#xff1f; 相关模式 场景 代码实现 定义订单接口 package com.zsp.bike.day08原型模式;/*** 订单的接口*…