ConcurrentHashMap原理及使用详解
作者:蜀山剑客李沐白
ConcurrentHashMap是Java中的一种线程安全的哈希表实现,它提供了与Hashtable和HashMap类似的API,但通过使用分段锁技术(Segment),使得多个线程可以同时读取和写入不同的数据块,从而提高了并发性能。同时,ConcurrentHashMap也支持弱一致性,即在某些情况下,读取操作可能会返回稍早的值,但这对于很多应用场景来说是可以接受的。该类还提供了一些有用的方法,如putIfAbsent()、replace()、compute()等,方便开发者进行基于哈希表的数据处理。总之,ConcurrentHashMap是一个高效且可靠的多线程环境下的哈希表实现,非常适合在并发场景中使用。
一、ConcurrentHashMap 的数据结构
ConcurrentHashMap 是 Java 中的一种线程安全的哈希表实现,其数据结构是由多个 Node 节点组成的数组和链表或红黑树。
在 ConcurrentHashMap 中,Node 节点是一个键值对,其中键为 K 类型,值为 V 类型。每个节点包含了一个哈希值、一个键和一个值,以及指向下一个节点的引用。具体而言,ConcurrentHashMap 的内部数据结构如下:
ConcurrentHashMap 中的每个 Segment 是一个独立的哈希表,而每个 Segment 又由多个 Bucket 组成,每个 Bucket 再维护一个链表或红黑树(红黑树出现的条件是 Bucket 中的元素数量大于等于 8)。
ConcurrentHashMap 的 put 操作可以分成两个步骤,首先根据 Key 的哈希值找到对应的 Segment 和 Bucket,然后在 Bucket 中插入新的 Node 节点。具体来说,它的处理流程如下:
- 对 Key 进行哈希操作,得到其哈希值。
- 根据哈希值和 Segment 数组的长度,计算出 Key 应该被放在哪个 Segment 中。
- 在 Segment 中获取 Key 应该放在哪个 Bucket 中。
- 如果该 Bucket 是空的,则直接在它的头部插入新的 Node 节点;否则,将新的 Node 节点插入到链表的尾部或红黑树上,并根据情况进行扩容或红黑树转换为链表。
- 如果插入新的节点后 Bucket 中的元素数量超过了一个阈值,则需要进行扩容操作。
- 如果插入新的节点后 Bucket 中的元素数量大于等于 8 个并且 Bucket 不是红黑树,则需要将链表转换为红黑树。
- 如果旧的红黑树中的节点数量少于 6 个,则需要将红黑树转换为链表。
ConcurrentHashMap 的 get 操作也很简单,直接根据 Key 的哈希值找到对应的 Segment 和 Bucket,然后在 Bucket 中查找对应的 Node 节点即可。
二、ConcurrentHashMap 的分段锁机制
ConcurrentHashMap 将整个哈希表分为多个 Segment,每个 Segment 又是一个独立的哈希表,可以单独进行加锁和扩容操作。在操作数据时,只需要获取对应 Segment 的锁,不需要锁住整个哈希表,这样可以避免多个线程之间的等待和竞争,同时提高吞吐量和并发性能。
简单实现示例:
class ConcurrentHashMap<K, V> { final Segment[] segments; class Segment extends ReentrantLock implements Serializable{ // 每个 Segment 自己独立的哈希表 private final Map<K,V> map = new HashMap<>(); // Segment 内部加锁机制,确保线程安全 public synchronized V put(K key, V value) { return map.put(key, value); } } // 获取 key 所属的 Segment 的索引 private int getSegmentIndex(K key) { int hash = hash(key.hashCode()); // 对 hashcode() 进行哈希 int segmentMask = segments.length - 1; // mask 值 return hash & segmentMask; // 按位与,定位具体的 Segment } public V put(K key, V value) { Segment s = segments[getSegmentIndex(key)]; s.lock(); // 获取 s 对应的 Segment 的锁 try { return s.put(key, value); // 在 s 上进行 put 操作 } finally { s.unlock(); // 释放 s 对应的 Segment 的锁 } } }
在实际的 ConcurrentHashMap 中,每个 Segment 会使用一个独立的哈希表来维护其内部的数据,同时也具备自己的锁机制,从而实现对其内部状态的并发安全访问。这样,不同线程访问不同的 Segment 时可以通过分段锁机制来实现并发访问,从而提高了 ConcurrentHashMap 的并发性能和吞吐量。
三、ConcurrentHashMap 的实现过程
在 JDK 1.8 以前,ConcurrentHashMap 的实现采用了与 Hashtable 类似的分段锁机制,每个 Segment 都对应一个 ReentrantLock 锁,用于并发访问。
而在 JDK 1.8 中,ConcurrentHashMap 引入了 CAS(Compare and Swap)技术,用于实现一个更加高效的并发控制机制。CAS 是一种无锁机制,可以避免线程争抢锁的情况。
我们以 put 操作为例,来看一下 ConcurrentHashMap 的实现过程:
- 首先计算 key 的哈希值;
- 根据哈希值找到对应的 Segment;
- 获取 Segment 对应的锁;
- 如果还没有元素,就直接插入到 Segment 中;
- 如果已经存在元素,就循环比较 key 是否相等;
- 如果 key 已经存在,就根据要求更新 value;
- 如果 key 不存在,就插入新的元素(链表或者红黑树)。
上述操作中,步骤 2 到 3 相当于加了一个悲观锁,在整个哈希表上加锁,如果只有一个 Segment,效果与 Hashtable 类似;如果存在多个 Segment,效果就相当于使用了分段锁机制,提高了并发访问性能。
四、使用场景案例
1. 高并发的计数器
ConcurrentHashMap 可以用来实现高并发的计数器,例如记录网站访问量、接口调用次数等。具体地,我们可以使用 ConcurrentHashMap 的 compute 方法来实现计数操作,如下所示:
import java.util.concurrent.ConcurrentHashMap; public class Counter { private final ConcurrentHashMap<String, Integer> map; public Counter() { this.map = new ConcurrentHashMap<>(); } public void increase(String key) { map.compute(key, (k, v) -> (v == null) ? 1 : v + 1); } public int get(String key) { return map.getOrDefault(key, 0); } }
在上述代码中,我们创建了一个 Counter 类,使用 ConcurrentHashMap 存储计数器数据。具体地,我们使用 compute 方法实现对计数器的增加操作,如果 key 不存在则新建一个值为 1 的计数器;否则将其递增 1。通过 get 方法可以获取指定 key 对应的计数器值。
2. 线程池任务管理
ConcurrentHashMap 还可以用来实现线程池任务的管理,例如记录每个任务的执行状态、结果等信息。具体地,我们可以将一个 ConcurrentHashMap 实例作为任务管理器,在任务执行前将任务信息添加到该管理器中,然后再在任务完成后更新对应的信息,如下所示:
import java.util.concurrent.ConcurrentHashMap; import java.util.concurrent.ExecutorService; import java.util.concurrent.Executors; import java.util.concurrent.TimeUnit; public class TaskManager { private final ConcurrentHashMap<String, TaskInfo> tasks; public TaskManager() { this.tasks = new ConcurrentHashMap<>(); } public void addTask(String taskId, Runnable task) { // 添加任务信息 tasks.put(taskId, new TaskInfo()); // 提交任务到线程池 ExecutorService executor = Executors.newCachedThreadPool(); executor.submit(() -> { try { // 执行任务 task.run(); // 更新任务状态和结果 TaskInfo info = tasks.get(taskId); info.setStatus(TaskStatus.COMPLETED); info.setResult("Task completed successfully!"); } catch (Exception ex) { // 更新任务状态和结果 TaskInfo info = tasks.get(taskId); info.setStatus(TaskStatus.FAILED); info.setResult(ex.getMessage()); } }); // 关闭线程池 executor.shutdown(); } public TaskInfo getTaskInfo(String taskId) { return tasks.getOrDefault(taskId, new TaskInfo()); } } enum TaskStatus { NEW, RUNNING, COMPLETED, FAILED; } class TaskInfo { private TaskStatus status; private String result; public TaskInfo() { this.status = TaskStatus.NEW; this.result = ""; } public TaskStatus getStatus() { return status; } public void setStatus(TaskStatus status) { this.status = status; } public String getResult() { return result; } public void setResult(String result) { this.result = result; } }
在上述代码中,我们创建了一个 TaskManager 类,使用 ConcurrentHashMap 存储任务信息。具体地,我们定义了一个 TaskInfo 类来表示任务信息,其中包括任务状态和结果两个属性。在添加任务时,我们新建一个 TaskInfo 实例并添加到 ConcurrentHashMap 中,然后在异步执行任务的线程中更新其状态和结果;同时我们使用 ExecutorService 来管理并发执行的任务。通过 getTaskInfo 方法可以获取指定 taskId 对应的任务信息。
3. 缓存管理器
ConcurrentHashMap 还可以用来实现缓存管理器,例如存储经常使用的业务数据、系统配置等信息,从而避免频繁的数据库查询或网络请求。具体地,我们可以使用 ConcurrentHashMap 存储缓存数据,并设定缓存过期时间,如下所示:
import java.util.Map; import java.util.concurrent.ConcurrentHashMap; public class CacheManager<K, V> { private final Map<K, CacheEntry<V>> cache; public CacheManager() { this.cache = new ConcurrentHashMap<>(); } public void put(K key, V value, long ttl) { // 添加缓存项,同时记录当前时间戳和缓存生存时间 CacheEntry<V> entry = new CacheEntry<>(value, System.currentTimeMillis(), ttl); cache.put(key, entry); } public V get(K key) { // 获取缓存项和其缓存生存时间 CacheEntry<V> entry = cache.get(key); // 检查缓存项是否过期,如果过期则删除缓存项并返回 null if (entry != null && !entry.isExpired()) { return entry.getValue(); } else { cache.remove(key); return null; } } static class CacheEntry<V> { private final V value; private final long timestamp; private final long ttl; public CacheEntry(V value, long timestamp, long ttl) { this.value = value; this.timestamp = timestamp; this.ttl = ttl; } public V getValue() { return value; } public boolean isExpired() { return System.currentTimeMillis() - timestamp > ttl; } } }
在上述代码中,我们创建了一个 CacheManager 类,使用 ConcurrentHashMap 存储缓存数据。具体地,我们定义了一个 CacheEntry 类来表示缓存项,其中包括值、时间戳和缓存生存时间三个属性。在添加缓存项时,我们新建一个 CacheEntry 实例并添加到 ConcurrentHashMap 中,然后在获取缓存项时检查其是否过期;如果未过期则返回其值,否则删除缓存项并返回 null。
以上就是ConcurrentHashMap 原理及使用详解的详细内容,更多关于ConcurrentHashMap 原理及用法的资料请关注脚本之家其它相关文章!