Java中的HashSet集合解析
作者:荆轲刺秦
HashSet集合解析
HashSet 实现 Set 接口,内部维护一个 HashMap 实例。它不能保证集合迭代的顺序,也不能保证顺序不变。HashSet 允许 null 元素。
该类对于基本操作,例如 add、remove、contains 和 size提供了常数时间的性能,迭代器的性能与 HashSet 实例的大小加上内部维护的 HashMap 的“容量”(即桶的数量)之和有关。所以,如果迭代性能很重要的话,并不建议把初始化容量设置的太大或者把负载因子设置的太小(HashMap 一文中有讲解)。
该集合并没有被同步,所以在有多个线程并发访问 HashSet 时,并且至少有一个集合修改了这个 Set ,它必须要额外的同步。这通常是对自然封装了该集合的某个对象进行同步来完成。比如 Collections的 synchronizedSet 方法返回的就是一个这样的对象。
初始化
初始化则主要是负责初始化内部维护的 HashMap,初始化策略遵循 HashMap 的初始化策略,默认大小为 16 ,负载因子为 0.75。
存取、删除操作
HashSet 中的基本操作是使用 HashMap 的操作实现的。
public boolean add(E e) { return map.put(e, PRESENT)==null; } public boolean remove(Object o) { return map.remove(o)==PRESENT; } public void clear() { map.clear(); }
PRESENT 是 Object 对象的实例,是为 HashMap 的 value 虚设的。尽管 HashMap 的 value 可以为 null,但是这里不适用 null 的原因很简单,因为使用 null ,则在 add 和 remove 操作时会产生歧义,无法区分 HashMap 中是否已经存在过旧的值。
迭代器
HashSet 的迭代器仍然是快速失败的,快速失败很好理解,在并发情况下,存在线程修改容器,那么其它正在迭代容器的线程将尽最大可能抛出 ConcurrentModificationException。从字面意思来看,依赖该异常来进行编程并不是很好的选择,我们可能不能够及时得到这个异常,仅仅将它用来检查 bug 还是可行的。
public Iterator<E> iterator() { return map.keySet().iterator(); }
可以发现,HashSet 的迭代器直接使用的 HashMap 的 keySet 方法返回的其内部实现的 KeySet 对象实例的迭代器。
前文有提到关于迭代器性能的问题,这是与 HashMap 特殊的底层数据结构有关(数组+链表或者数组+红黑树),无论是哪种,遍历都是先从数组中的第一个元素(即“桶”)开始,接着遍历桶中的元素,直到整个数组遍历完成。
所以,其性能和数组的大小加上元素数量之和有关。
到此这篇关于Java中的HashSet集合解析的文章就介绍到这了,更多相关HashSet集合解析内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!