什么是ThreadLocal?
通常情况下,我们创建的变量是可以被任何一个线程访问并修改的。如果想实现每一个线程都有自己的专属本地变量该如何解决呢?
JDK 中自带的ThreadLocal
类正是为了解决这样的问题。 ThreadLocal
类主要解决的就是让每个线程绑定自己的值,可以将ThreadLocal
类形象的比喻成存放数据的盒子,盒子中可以存储每个线程的私有数据。
如果你创建了一个ThreadLocal
变量,那么访问这个变量的每个线程都会有这个变量的本地副本,这也是ThreadLocal
变量名的由来。他们可以使用 get()
和 set()
方法来获取默认值或将其值更改为当前线程所存的副本的值,从而避免了线程安全问题
ThreadLocal 原理了解吗?
最终的变量是放在了当前线程的 ThreadLocalMap
中,并不是存在 ThreadLocal
上,ThreadLocal
可以理解为只是ThreadLocalMap
的封装,传递了变量值。 ThreadLocal
类中可以通过Thread.currentThread()
获取到当前线程对象后,直接通过getMap(Thread t)
可以访问到该线程的ThreadLocalMap
对象。
每个Thread
中都具备一个ThreadLocalMap
,而ThreadLocalMap
可以存储以ThreadLocal
为 key ,Object 对象为 value 的键值对。
在
ThreadLocal
类中有静态内部类ThreadLocalMap
,在ThreadLocalMap
类中也有静态内部类Entry
,而这个Entry
类继承自WeakReference
static class ThreadLocalMap { static class Entry extends WeakReference<ThreadLocal<?>> { Object value; Entry(ThreadLocal<?> k, Object v) { super(k); value = v; } }
//.....
}
比如我们在同一个线程中声明了两个 ThreadLocal
对象的话, Thread
内部都是使用仅有的那个ThreadLocalMap
存放数据的,ThreadLocalMap
的 key 就是 ThreadLocal
对象,value 就是 ThreadLocal
对象调用set
方法设置的值。
ThreadLocal
数据结构如下图所示:
在每条线程Thread内部有一个ThreadLocal.ThreadLocalMap类型的成员变量threadLocals,这个threadLocals就是每条线程用来存储变量副本的,key值为当前ThreadLocal对象,value为变量副本(即T类型的变量)。每个Thread线程对象最开始的threadLocals都为空,当线程调用ThreadLocal.set()或ThreadLocal.get()方法时(get方法待会而会分析到),都会调用createMap()方法对threadLocals进行初始化。然后在当前线程里面,如果要使用副本变量,就可以通过get方法在threadLocals里面查找。
ThreadLocalMap
ThreadLocal
的原理是涉及三个核心类:ThreadLocal
、Thread
以及ThreadLocalMap
类。在Thread
类中存在两个成员变量:threadLocals
与inheritableThreadLocals
,这两个成员变量的类型都为ThreadLocalMap
,经过一系列分析后我们可以得知,这两个成员变量是存储线程变量副本的最终容器,而前面也曾提到过:ThreadLocalMap
是ThreadLocal
中定制版的HashMap
,但是它并没有实现Map
接口,而是自己内部通过数组类型存储Entry
实现。而Entry
只是简单的继承了WeakReference
弱引用,并没有没有实现类似HashMap
中Node.next
的后继节点指向,所以ThreadLocalMap
并不是链表形式的实现。哪没有了链表结构之后,ThreadLocalMap
是如何解决哈希冲突的呢?
ThreadLocalMap
是如何解决哈希冲突的呢? ---开放寻址法
在调用createMap()
方法创建ThreadLocalMap
示例时,在ThreadLocalMap
的构造方法中,会为成员变量table
初始化一个长度为16的Entry
数组,通过hashCode
与length
位运算确定出一个下标索引值i
,这个i
就是被存储在table
数组中的下标位置。
每条线程的threadlocals
都会在内部维护独立table
数组,而每个ThreadLocal
对象在不同的线程table
中位置都是相同的。对于同一条线程而言,不同的ThreadLocal
变量副本都会被封装成一个个的Entry
对象存储在自己内部的table
中。
ok~,接着往下说,经过int i = key.threadLocalHashCode & (len-1);
计算出索引下标值之后,会开始遍历table
,然后会开始判断,如果table[i]
位置不为空,但是原本的key值和现在新的key值是相同的情况下,则使用现在的新值替换掉之前的老值,刷新value值并返回;如果table[i]
位置为空,则创建一个的Entry
对象封装K-V
值并将该对象放在table[i]
位置;如果table[i]
位置不为空并且Key
不相同时,哪就调用nextIndex(i,len)
获取下一个位置信息并判断下一个位置是否为空,直到找到为空的位置为止;在table[i]
位置不为空并且Key
不相同的情况下,如果遍历完整个table
数组也没有找到为空的下标位置时,代表数组已经存满了需要扩容,则调用rehash()
对数组扩容两倍
整个ThreadLocalMap存储过程结束,如下:
在get时,也会根据ThreadLocal
对象的哈希值跟table
数组长度进行计算获取下标索引值i
,然后判断该位置Entry
对象的key值与get(key)
的key是否相同,如果相同则直接获取该位置的值并返回。如果不相同则遍历整个数组中table[i]
之后的所有元素,循环判断下一个位置的key是否与传入进来的key一致,如果一致则获取返回
ThreadLocal 内存泄露问题是怎么导致的?
ThreadLocalMap
中使用的 key 为 ThreadLocal
的弱引用,而 value 是强引用。所以,如果 ThreadLocal
没有被外部强引用的情况下,在垃圾回收的时候,key 会被清理掉,而 value 不会被清理掉。
这样一来,ThreadLocalMap
中就会出现 key 为 null 的 Entry。假如我们不做任何措施的话,value 永远无法被 GC 回收,这个时候就可能会产生内存泄露。ThreadLocalMap
实现中已经考虑了这种情况,在调用 set()
、get()
、remove()
方法的时候,会清理掉 key 为 null 的记录。使用完 ThreadLocal
方法后最好手动调用remove()
方法
可不可以把value也变成弱引用?
不可以。因为存进ThreadLocal中正在使用的对象,在线程的栈中也有引用的,这是一根强引用指针,所以只要线程还在使用,就算内存不足,对应的Key也不会被回收;反之,如果key和value的关系都设计成弱引用,这时假设内存不足,触发GC就会导致value被回收,因为线程本身不直接持有value,而是通过key来间接性的访问value,如果value也是弱引用,就会出现“key还在,value因为内存不足,导致被GC回收”的问题
可不可以把key变成强引用?
不可以。既然key被设计成了弱引用,所以才会导致key=null的情况出现,那假设把key设计成强引用,是不是就解决了这个问题呢?先看个例子:
public static void main(String[] args) { ThreadLocal TL = new ThreadLocal(); TL.set(new Object()); TL = null;
}
这里创建了一个ThreadLocal对象TL,并设置一个Object对象,然后将其置空。如果Key是强引用的话,TL无法被回收,也无法被访问,Object无法被回收,也无法被访问,Key和Value同时出现了内存泄漏。
为啥K-V都内存泄漏了呢?因为最后一行置空代码,只能将main线程栈中的引用置空,而Thread对象内部有一个threadLocals成员,依旧会保持与ThreadLocalMap的引用,而Map的Key又强引用自ThreadLocal,这时main线程的栈,虽然没有引用这个TL,但Map却在引用着它,最终就导致了K-V都内存泄漏。
上面也是ThreadLocalMap中,为什么Key被设计成弱引用的原因,而且ThreadLocal也在尽可能的避免内存泄漏,当你调用set/get/remove()方法时,都会清理过期的Key(调用remove方法是最有效的)
综上所述:key设计成弱引用反而是最好的选择
ThreadLocalMap扩容机制了解吗?
- 触发扩容的条件
ThreadLocalMap
的初始容量是 16,它在存储元素时,当元素个数达到阈值(threshold
)就会触发扩容。阈值的计算方式是数组容量(table.length
)的三分之二。- 例如,初始容量为 16 时,当存储的元素个数达到
16 * 2/3 = 10
(向下取整)个元素时,就会触发扩容。
- 扩容过程
- 扩容是创建一个新的
Entry
数组,新数组的大小是原来的两倍。 - 然后遍历旧数组中的所有
Entry
,将其重新哈希(rehash)到新数组中。在重新哈希的过程中,会处理可能出现的哈希冲突。 - 对于哈希冲突,
ThreadLocalMap
采用线性探测法来解决。即当发生冲突时,会顺序查找下一个可用的位置来存储元素。在扩容后的重新哈希过程中,这个线性探测的逻辑也会起作用。 - 假设旧数组中有一个
Entry
在位置i
,重新哈希时,它会先计算新的索引位置i' = i & (newLength - 1)
(其中newLength
是新数组的长度),如果这个位置没有被占用,就将Entry
放入该位置;如果被占用了,就会线性探测下一个位置,直到找到一个空闲位置。
- 扩容是创建一个新的
ThreadLocal怎么实现线程隔离的?
由于每个线程都有自己独立的ThreadLocalMap
,所以不同线程之间的ThreadLocal
变量是相互隔离的。即使多个线程使用了相同的ThreadLocal
对象,它们所操作的也是各自线程中的变量副本,不会相互影响。
要说是怎么实现线程隔离的,其实就是在set()、get()方法的具体实现,我们set的值,为什么不会被其他的线程所读取。
Set()方法:
public void set(T value) {// 1、获取当前线程Thread t = Thread.currentThread();// 2、获取当前线程的threadlocals成员变量ThreadLocalMap map = getMap(t);// 3、判断map是否为nullif (map != null)// 如果不为null,就直接将value放进map中// key是当前的threadLocal,value就是传进来的值map.set(this, value);else// 如果为 null,初始化一个map,再将value 放进map中// key是当前的threadLocal,value就是传进来的值createMap(t, value);
}
Get()方法:
public T get() {// 获取到当前线程Thread t = Thread.currentThread();// 2、获取当前线程的threadlocals成员变量ThreadLocalMap map = getMap(t);//3、判断map是否为nullif (map != null) //3.1、如果不为null,根据当前的ThreadLocal 从当前线程中的ThreadLocals中取出map存储的变量副本ThreadLocalMap.Entry e = map.getEntry(this);// 如果存储的值不为null,就返回值if (e != null) {@SuppressWarnings("unchecked")T result = (T)e.value;return result;}}//return setInitialValue();
}
- 当在一个线程中调用
ThreadLocal
的get()
方法获取变量值时,它会首先获取当前线程的ThreadLocalMap
,然后根据当前的ThreadLocal
对象作为键,从ThreadLocalMap
中查找对应的变量值并返回。如果找不到,则会返回null
或根据初始化方法返回默认值。
这就是ThreadLocal的原理~~~❤️❤️❤️