Java中的Set集合源码详细解读
作者:缘之妙不可言
Set集合
Set注重独一无二的性质,该体系集合用于存储无序(存入和取出的顺序不一定相同)元素, 值不能重复。
对象的相等性本质是对象hashCode值(java 是依据对象的内存地址计算出的此序号)判断的(去重), 如果想要让两个不同的对象视为相等的,就必须覆盖Object的hashCode方法和equals方法。
HashSet,(一张hash表)
哈希表边存放的是哈希值。HashSet 存储元素的顺序并不是按照存入时的顺序(和List显然不同)而是按照哈希值来存的所以取数据也是按照哈希值取得。 元素的哈希值是通过元素的hashCode方法来获取的, **HashSet首先判断两个元素的哈希值,如果哈希值一样,接着会比较equals方法如果equals结果为true,HashSet 就视为同一个元素。**如果equals为false就不是同一个元素。 哈希值相同equals为false的元素存储: 在同样的哈希值下顺延(可以认为哈希值相同的元素放在一个哈希桶中)。也就是哈希一样的存一列
TreeSet(二叉树)
- TreeSet()是使用二 叉树的原理对新add)的对象按照指定的顺序排序(升序、降序),每增加一个对象都会进行排序,将对象插入的二叉树指定的位置。
- Integer 和String对象都可以进行默认的TreeSet排序,而自定义类的对象是不可以的,自己定义的类必须实现Comparable接口,并且覆写相应的compareTo)函数,才可以正常使用
- 在覆写 compare()函数时,要返回相应的值才能使TreeSet按照一定的规则来排序。
- 比较此对象与指定对象的顺序。如果该对象小于、等于或大于指定对象,则分别返回负整 数、零或正整数。
LinkHashSet (HashSet+ LinkedHashMap)
对于LinkedHashSet 而言,它继承与HashSet、 又基于LinkedHashMap 来实现的。
LinkedHashSet底层使用LinkedHashMap来保存所有元素,它继承与HashSet,其所有的方法操作_上又与HashSet相同,因此LinkedHashSet的实现上非常简单,只提供了四个构造方法,并通过传递-一个标识参数,调用父类的构造器,底层构造-个LinkedHashMap 来实现,在相关操作.上与父类HashSet的操作相同,直接调用父类HashSet的方法即可。
HashSet源码
Set是基于HashMap实现的,源码主要体现的是它的独一无二,不可重复性
HashSet构造方法(4个)就是新建一个HashMap(参考HashMap的构造,共四个)
public HashSet() { map = new HashMap<>(); }
我们再看一下官方类注释:
此类实现Set接口,支持由哈希表(实际上是一个HashMap实例)。 它不保证为向集合的迭代顺序; 特别是,它不保证该顺序恒久不变。 此类允许null元素。
这个类提供了基本操作( 添加 , 删除 , 包含和大小 ),假定哈希函数将恒定的时间性能分散的元素正确的桶中。 遍历该集合需要时间正比于HashSet实例的大小(元素的数量)加上其底层HashMap实例的“容量”(桶的数量)的总和。 因此,不要将初始容量设置得太高(或负载因数过低),如果迭代性能很重要,非常重要。
注意,此实现不是同步的。 如果多个线程同时访问一个散列集,螺纹修改的和至少一个设定的,它必须被外部同步。 这通常是通过一些对象自然封装该组同步操作来完成。 如果该对象不存在,该组应该被“包装”使用Collections.synchronizedSet方法。 这最好在创建时完成,以防止对set的意外非同步访问:
Set s = Collections.synchronizedSet(new HashSet(...));
此类的iterator方法返回的迭代器是快速失败的 :如果集合随时修改创建迭代器之后,以任何方式除非通过迭代器自身的remove方法,迭代器将抛出ConcurrentModificationException 。 因此,在并发的修改,迭代器很快就会完全失败,而不是在将来不确定的时间任意冒险,不确定性的行为。
注意的迭代器无法保证,因为,一般来说快速失败行为,不可能作出任何硬性保证不同步并发修改的存在。 快速失败的迭代器抛出ConcurrentModificationException尽最大努力的基础上。 因此,这将是错误的,写一个程序,依赖于此异常的它的正确性: 迭代器的快速失败行为应该仅用于检测bug。
这个类是成员的Java集合框架
阐述关键:
- 元素无序
- 允许null元素
- 迭代时允许快速失败,既是线程不安全的(继承的HashMap的内容),就是不能在迭代时被其它线程以任何形式修改结构,这几乎是所有集合的保护机制(Vector除外)(不懂可自行百度)
HashSet集合不少源码都得在HashMap中才看得到, 源码中还有一些多的功能: 例如序列化与反序列化:
//序列化 private void writeObject(java.io.ObjectOutputStream s) throws java.io.IOException { // Write out any hidden serialization magic s.defaultWriteObject(); // Write out HashMap capacity and load factor s.writeInt(map.capacity()); s.writeFloat(map.loadFactor()); // Write out size s.writeInt(map.size()); // Write out all elements in the proper order. for (E e : map.keySet()) s.writeObject(e); } /** 反序列化 */ private void readObject(java.io.ObjectInputStream s) throws java.io.IOException, ClassNotFoundException { // Read in any hidden serialization magic s.defaultReadObject(); // Read capacity and verify non-negative. int capacity = s.readInt(); if (capacity < 0) { throw new InvalidObjectException("Illegal capacity: " + capacity); } // Read load factor and verify positive and non NaN. float loadFactor = s.readFloat(); if (loadFactor <= 0 || Float.isNaN(loadFactor)) { throw new InvalidObjectException("Illegal load factor: " + loadFactor); } // Read size and verify non-negative. int size = s.readInt(); if (size < 0) { throw new InvalidObjectException("Illegal size: " + size); } capacity = (int) Math.min(size * Math.min(1 / loadFactor, 4.0f), HashMap.MAXIMUM_CAPACITY); // Create backing HashMap map = (((HashSet<?>)this) instanceof LinkedHashSet ? new LinkedHashMap<E,Object>(capacity, loadFactor) : new HashMap<E,Object>(capacity, loadFactor)); // Read in all elements in the proper order. for (int i=0; i<size; i++) { @SuppressWarnings("unchecked") E e = (E) s.readObject(); map.put(e, PRESENT); } }
TreeSet源码
没什么太多说的,还是以TreeMap集合为基础,添加Set的特点,与HashSet&HashMap差不多
HashSet去重
hashSet元素独一无二
去重判断有两个条件因子(Object的方法):
1.hashCode() 【java根据对象的内存地址计算的Hash值】
2.equals() 【在条件一返回hash值相同时,会使用此方法进行判断,如果返回true,则表明是同一元素,一般是一个多属性对象的自定义相对方式(重写对象的equals())】
到此这篇关于Java中的Set集合源码详细解读的文章就介绍到这了,更多相关Set集合源码内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!