为什么HashSet不能保持唯一性? [重复]

问题描述 投票:-3回答:2

考虑员工类 -

public class Employer implements Serializable{

  private Long id;
  private String name;

  @Override
  public boolean equals(Object obj) {

    if (obj == null)
        return false;
    if (obj instanceof Employer) {
        Employer employer = (Employer) obj;
        if (this.id == employer.id) {
            return true;
        } 
    }
    return false;
  }

  //Idea from effective Java : Item 9
  @Override
  public int hashCode() {
    int result = 17;
    result = 31 * result + id.hashCode();
    //result = 31 * result + name.hashCode();
    return result;
  }
}

创建了2个员工对象 -

Employer employer1 = new Employer();
employer1.setId(10L);

Employer employer2 = new Employer();
employer2.setId(11L);

将它们添加到hashset后,大小将为2. HashSet内部使用hashmap来保持唯一性 -

private transient HashMap<E,Object> map;
public boolean add(E e) {
        return map.put(e, PRESENT)==null;
}

现在,如果我将第二个员工的id设置为与第一个员工的id相同,即 -

employer2.setId(10L);

大小仍然是2.为什么不是1? in-variants是否会被破坏?

java hashset
2个回答
8
投票

所有基于散列的容器(包括HashSet<T>)都对其键的哈希码做出了非常重要的假设:它们假设哈希代码在对象位于容器内时永远不会改变。

您的代码通过在实例仍在哈希集中时修改实例来违反此假设。 HashSet<T>没有实际的方法来应对这种变化,因此您必须选择以下两种方法之一来解决此问题:

  • 永远不要修改基于散列的容器的密钥 - 这是迄今为止最常用的方法,通常通过使哈希密钥不可变来实现。
  • 跟踪修改,并手动重新哈希对象 - 本质上,您的代码确保在哈希键位于容器外时对哈希键进行所有修改:从容器中删除对象,进行修改,然后将其放回原处。

第二种方法经常成为维护头痛的根源。当您需要在基于散列的容器中保留可变数据时,一种好方法是在计算哈希代码和相等性检查时仅使用final字段。在你的例子中,这意味着制作id字段final,并从类中删除setId方法。


8
投票

大小仍然是2.为什么不是1? in-variants是否会被破坏?

如果您修改用于计算hashCode中已有的实例的equalsHashSet的任何属性,则HashSet实现不知道该更改。

因此它将保留这两个实例,即使它们现在彼此相等。

您不应对作为成员或HashSets(或HashMaps中的键)的实例进行此类更新。如果必须进行此类更改,请在变更之前从Set中删除该实例,然后再重新添加。

© www.soinside.com 2019 - 2024. All rights reserved.