自定义对象作为HashMap的Key问题
作者:浮华饰浮华
自定义对象作为HashMap的Key
这个问题在很多面试者面试时都会被提及,本人也是最近在看effective java第九条:覆盖equals时总要覆盖hashcode回想到了当初面试时也被问到了这个问题.于是动手写了几行代码,还真发现了一些小的问题,所以拿出来分享一下!
首先我们自定义一个学生对象,它有姓名和年龄两个字段.
class Student{ public String name; public Integer age; Student(String name,Integer age){ this.name = name; this.age = age; } @Override public boolean equals(Object o) { //return true; if(o==this) return true; if(!(o instanceof Student)) return false; Student s = (Student)o; return s.name.equals(name)&&s.age.equals(age); } @Override public int hashCode() { int result = 17; result = 31 * result + name.hashCode(); result = 31 * result + age; return result; } }
(PS)上面的代码是一个能作为hashMap的key对象的完整代码.包括重写了equals方法和hashCode方法.在重写equals方法时我还遇到了一个麻烦事,一开始我是下面这样写的:
@Override public boolean equals(Object o) { //*********** return s.name.equals(name)&&s.age==age; }
相信都能找到原因,age是Integer对象而不是int所以比较的是地址值,于是乎无论如何都不能得到我想要的结果.
然后我们接着把对象装入HashMap结构中,并取出,看是否能够成功?
static void demo2(){ Map<Student, String> map = new HashMap<Student, String>(); long l1 = System.currentTimeMillis(); for(int i = 0;i<10000;i++){ map.put(new Student("dy"+i, i), ""+i); } long l2 = System.currentTimeMillis(); System.out.println(map.get(new Student("dy9999",9999))); long l3 = System.currentTimeMillis(); System.out.println((l2-l1)); System.out.println((l3-l2)); }
结果如下
9999
8
0
已经成功了!
那么可能有点新的问题了!那就是Student对象的hashCode方法是怎么实现的呢?equals方法大家都会重写.那么究竟怎么一个算法能让不同的对象具有不同的散列值呢?下面这段描述摘抄自effective java给我们的建议:
1.把某个非零的常数值,比如说17(一个你喜欢的数字),保存在一个名为result的int类型的变量中.
2.对于对象中每个关键域(指equals方法中涉及的每个域),完成以下步骤:
- a.为该域计算int类型的散列码c:
i.如果该域是boolean类型,则计算(f?1:0)
ii.如果该域是byte,char,short或者int类型,则计算(int)f.
iii.如果该域是long类型,则计算(int)(f^(f>>>32)).
iv.如果该域是float类型,则计算Float.floatToIntBits(f).
v.如果该域是double类型,则计算Double.doubleToLongBits(f),然后按照步骤2.a.iii,为得到的long类型值计算散列值.
vi.如果该域是一个对象引用,并且该类的equals方法通过递归地调用equals的方式来比较这个域,则同样为这个域递归地调用hashCode.如果需要更加复杂的比较,则为这个域计算一个"范式",然后针对这个范式调用hashCode.如果这个域的值为null,则返回0(或者其他某个常数,但通常是0).
vii.如果该域是一个数组,则要把每一个元素当做单独的域来处理.也就是说,递归地应用上述规则,对每个重要的元素计算一个散列码,然后根据步骤2.b中的做法把这些散列值组合起来.如果数组域中的每个元素都很重要,可以利用发行版本1.5中增加的其中一个Arrays.hashCode方法.
- b.按照下面的公式,把步骤2.a中计算得到的散列码c合并到result中:
result = 31 * result +c;
3.返回result
当然如果我们不重写hashCode方法会出现什么情况呢?请看:
null
8
0
返回结果为null,因为Student类没有重写hashCode方法,从而导致两个相等的实例具有不相等的散列码,违反了hashCode的约定.因此put方法把对象放在一个散列桶中,而get方法却在另一个散列桶中取值.即使这两个实例恰好被放在同一个散列桶中,get方法也必定会返回null,因为HashMap有一项优化,可以将与每个相关联的散列码缓存起来,如果散列码不匹配,也不必检查对象的等同性!这正说明了effective java第九条:覆盖equals方法时总要覆盖hashCode.但是现在又有一个问题了,如果我重写的hashCode代码如下会如何呢?
@Override public int hashCode() { /*int result = 17; result = 31 * result + name.hashCode(); result = 31 * result + age;*/ return 32; }
运行的结果如下:
9999
2305
1
可以看到的是,由于每个对象都具有相同的散列值,因此,每个对象都被映射到同一个散列桶中,使散列表退化为链表,它使得本该线性时间运行的程序变成了以平方级时间在运行.
关于对象实现Compareable接口可以参考这篇文章(Java 8 HashMap键与Comparable接口).
HashMap使用自定义对象作为Key的注意点
1. 自定义对象不重写hashCode方法和equals会发生什么?
public class AboutHashMap { public static void main(String[] args) { Student s1 = new Student("张三",18); Student s2 = new Student("张三",18); System.out.println(s1.hashCode()); //21685669 System.out.println(s2.hashCode()); //2133927002 System.out.println(s1.hashCode() == s2.hashCode()); //false System.out.println(s1.equals(s2)); //false } } class Student { private String name; private int age; // 省略getter,setter,有参构造 }
结论:
当我们不重写Student对象的hashCode方法和equals方法时,Student对象沿用的就是Object对象的hashCode方法和equals方法;从上面代码的测试来说,即使两个属性相同的对象他们的hash值都是不一样的,调用equals方法进行比较,他们也是不相同的。
总结:
- Object对象的equals方法比较的是两个对象的内存地址。
- Object类的hashCode返回对象的内存地址经过处理后得到的值,由于每个对象的内存地址都不一样,所以哈希码也不一样。
public native int hashCode(); public boolean equals(Object obj) { return (this == obj); }
2. 在HashMap中使用自定义对象作为key会发生什么?
public class AboutHashMap { public static void main(String[] args) { Student s1 = new Student("张三",18); // 两个相同属性的对象 Student s2 = new Student("张三",18); Map<Student, Integer> hashMap = new HashMap<>(); hashMap.put(s1, 99); // 使用属性相同的对象s2去调用get方法 System.out.println( hashMap.get(s2) ); // null } } class Student { private String name; private int age; // 省略getter,setter,有参构造方法,toString方法 }
分析:
我们可以发现,通过一个属性一模一样的s2去get哈希表中的元素竟然找不到前面put过的 s1-99!!!???
解释:
put入的元素在HashMap中数组结构的位置由key的hashCode方法返回值来决定,而此时自定义对象hashCode方法(未重写),返回值是由对象的内存地址值计算而来的,因此即使两个对象的属性完全相同,他们的哈希值也不同,所以即使两个属性完全相同的对象在HashMap中也完全找不到。
总结:
使用自定义对象作为HashMap的key不重写hashCode和equals方法会产生的问题
- get方法:使用属性完全相同的对象作为key去get元素会找不到元素。
- put方法:即使是有属性完全相同的对象put到HashMap中,也不会覆盖已有的value值,只会当作新元素加入到HashMap中
- 即使发生hash冲突,调用equal方法比较两个属性完全相同的对象也会返回false
所以要想顺利使用自定义对象作为hashMap的key就必须正确重写hashCode和equals方法。
3. 重写hashCode方法和equals方法的原则
equals
:
- 相等的两个key实例调用equals()必须返回true(相等指的是属性完全相等)。
hashCode
:
- 如果两个对象相等,则两个对象的hashCode()必须相等;
- 如果两个对象不相等,则两个对象的hashCode()尽量不要相等, (为了减少发生hash冲突的情况)。
ps:在IDEA中使用 ALT + INSERT可以快速帮我们实现equals和hashcode方法
class Student { private String name; private int age; @Override public boolean equals(Object o) { if (this == o) return true; if (o == null || getClass() != o.getClass()) return false; Student student = (Student) o; return age == student.age && name.equals(student.name); } @Override public int hashCode() { return Objects.hash(name, age); } }
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。