ConcurrentHashMap完全安全吗?

问题描述 投票:44回答:6

这是来自JavaDoc关于ConcurrentHashMap的一段话。它说检索操作通常不会阻塞,因此可能与更新操作重叠。这是否意味着get()方法不是线程安全的?

“但是,即使所有操作都是线程安全的,检索操作也不需要锁定,并且没有任何支持以阻止所有访问的方式锁定整个表。这个类可以在依赖于的程序中与Hashtable完全互操作。它的线程安全,但不是它的同步细节。

检索操作(包括get)通常不会阻塞,因此可能与更新操作(包括put和remove)重叠。检索反映了最近完成的更新操作的结果。“

java multithreading synchronized java.util.concurrent
6个回答
50
投票

get()方法是线程安全的,其他用户为您提供了有关此特定问题的有用答案。

但是,尽管ConcurrentHashMapHashMap的线程安全替代品,但重要的是要意识到如果您正在执行多个操作,则可能必须显着更改代码。例如,请使用以下代码:

if (!map.containsKey(key)) 
   return map.put(key, value);
else
   return map.get(key);

在多线程环境中,这是竞争条件。你必须使用ConcurrentHashMap.putIfAbsent(K key, V value)并注意返回值,它告诉你put操作是否成功。阅读文档了解更多详情。


回答评论,要求澄清为什么这是竞争条件。

想象一下,有两个线程AB将分别在地图中放置两个不同的值,v1v2,具有相同的密钥。密钥最初不在地图中。它们以这种方式交错:

  • 线程A调用containsKey并发现密钥不存在,但立即被暂停。
  • 线程B调用containsKey并发现密钥不存在,并且有时间插入其值v2
  • 线程A恢复并插入v1,“和平”覆盖(因为put是线程安全)线程B插入的值。

现在线程B“认为”它已成功插入其自己的值v2,但地图包含v1。这真是一场灾难,因为线程B可能会调用v2.updateSomething()并且会“认为”地图的消费者(例如其他线程)可以访问该对象,并且会看到可能重要的更新(“喜欢:此访问者IP地址正在尝试执行DOS,拒绝从现在开始的所有请求“)。相反,该对象将很快被垃圾收集和丢失。


17
投票

它是线程安全的。但是,它的线程安全方式可能不是您所期望的。您可以从以下方面看到一些“提示”:

在依赖于线程安全但不依赖于其同步细节的程序中,此类可与Hashtable完全互操作

要以更完整的图片了解整个故事,您需要了解ConcurrentMap界面。

原始的Map提供了一些非常基本的读/更新方法。即使我能够实现Map的线程安全实现;有很多情况下人们不考虑我的同步机制就无法使用我的Map。这是一个典型的例子:

if (!threadSafeMap.containsKey(key)) {
   threadSafeMap.put(key, value);
}

这段代码不是线程安全的,即使地图本身也是如此。两个线程同时调用containsKey()可能会认为没有这样的密钥,因此它们都插入到Map中。

为了解决这个问题,我们需要明确地进行额外的同步。假设我的Map的线程安全性是通过同步关键字实现的,您需要这样做:

synchronized(threadSafeMap) {
    if (!threadSafeMap.containsKey(key)) {
       threadSafeMap.put(key, value);
    }
}

这些额外的代码需要您了解地图的“同步细节”。在上面的例子中,我们需要知道同步是通过“synchronized”实现的。

ConcurrentMap界面更进了一步。它定义了一些涉及多个地图访问的常见“复杂”操作。例如,上面的示例公开为putIfAbsent()。通过这些“复杂”操作,ConcurrentMap的用户(在大多数情况下)不需要通过多次访问地图来同步操作。因此,Map的实现可以执行更复杂的同步机制以获得更好的性能。 ConcurrentHashhMap就是一个很好的例子。事实上,线程安全是通过为地图的不同分区保留单独的锁来维护的。它是线程安全的,因为对映射的并发访问不会破坏内部数据结构,或导致任何更新丢失意外等。

考虑到上述所有因素,Javadoc的含义将更加清晰:

“检索操作(包括get)通常不会阻止”因为ConcurrentHashMap没有使用“synchronized”来保证其线程安全性。 get本身的逻辑照顾线程安全;如果你在Javadoc中进一步观察:

该表在内部进行分区,以尝试允许指定数量的并发更新而不会发生争用

检索非阻塞,甚至更新都可以同时发生。但是,非阻塞/并发更新并不意味着它是线程UNsafe。它只是意味着它使用除了简单的“同步”之外的一些方法来实现线程安全。

但是,由于未公开内部同步机制,如果您想执行除ConcurrentMap提供的操作之外的一些复杂操作,您可能需要考虑更改逻辑,或者考虑不使用ConcurrentHashMap。例如:

// only remove if both key1 and key2 exists
if (map.containsKey(key1) && map.containsKey(key2)) {
    map.remove(key1);
    map.remove(key2);
}

10
投票

从某种意义上讲,ConcurrentHashmap.get()是线程安全的

  • 它不会抛出任何异常,包括ConcurrentModificationException
  • 它会返回一个过去某个(最近)时间的结果。这意味着两次背靠背调用get可以返回不同的结果。当然,这也适用于任何其他Map

7
投票

HashMap根据"buckets"分为hashCodeConcurrentHashMap使用了这个事实。它的同步机制基于阻塞桶而不是整个Map。这样,很少有线程可以同时写入几个不同的桶(一个线程可以一次写入一个桶)。

ConcurrentHashMap读取几乎不使用同步。在获取key的值时使用同步,它会看到null值。由于ConcurrentHashMap不能将null存储为值(是的,除了键,值也不能是nulls),它建议在读取时在另一个线程初始化映射条目(键值对)的过程中获取null:密钥已分配,但值尚未分配,并且仍保留默认值null。 在这种情况下,读取线程需要等到输入完全写入。

所以来自read()的结果将基于当前的地图状态。如果您读取了更新过程中的键值,则可能会因为写入过程尚未完成而获得旧值。


5
投票

ConcurrentHashMap中的get()是线程安全的,因为它读取的是Volatile值。在任何键的值为null的情况下,get()方法等待直到获得锁定然后它读取更新的值。

put()方法更新CHM时,它会将该键的值设置为null,然后创建一个新条目并更新CHM。 get()方法使用此空值作为另一个线程使用相同密钥更新CHM的信号。


4
投票

它只是意味着当一个线程正在更新并且一个线程正在读取时,不能保证首先及时调用ConcurrentHashMap方法的线程将首先执行它们的操作。

考虑项目的更新,告诉鲍勃在哪里。如果一个线程询问Bob所处的位置,而另一个线程在更新时说他进入“内部”,则无法预测读者线程是否会将Bob的状态设置为“内部”或“外部”。即使更新线程首先调用该方法,读取器线程也可能会获得“外部”状态。

线程不会引起彼此的问题。代码是线程安全的。

一个线程不会进入无限循环或开始生成奇怪的NullPointerExceptions,或者使用旧状态的一半和新的一半获得“itside”。

© www.soinside.com 2019 - 2024. All rights reserved.