集合框架Map笔记
Map概述
Map用于保存具有映射(一对一)关系的数据,Map集合保存两个值,一个是key(键),一个是值(value),key和value都可以是任何引用类型的数据。key不允许重复,value可以重复。
通过key,总能找到唯一的,确定的value。
Map的实现类有HashMap,Hashtable,Properties,SortedMap等。
HashMap
常用API
方法 | 描述 |
---|---|
put(K key,V value) | 添加键值对 |
get(Object key) | 根据键获取值 |
keySet() | 获取keySet |
entrySet() | 获取entrySet |
clear() | 清空 |
containsKey(Object key) | 判断是否存在key |
remove(Object key) | 根据key删除键值对 |
remover(Object key,Object value) | 根据key和value删除键值对 |
size() | 获取元素个数 |
isEmpty() | 判断map是否为空 |
HashMap存放元素的流程
HashMap的元素存放是一个复杂的过程,过程中涉及到哈希表的扩容,红黑树和链表的相互转换。
HashMap中几个关键的成员变量:
//HashMap默认容量16
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;
//HashMap最大容量
static final int MAXIMUM_CAPACITY = 1 << 30;
//HashMap负载因子
static final float DEFAULT_LOAD_FACTOR = 0.75f;;
//链表转换为红黑树的阈值
static final int TREEIFY_THRESHOLD = 8;
//红黑树转换为链表的阈值
static final int UNTREEIFY_THRESHOLD = 6;
//链表转换为红黑树时Hash表的容量阈值
static final int MIN_TREEIFY_CAPACITY = 64;
//保存HashMap的Hash表
transient Node<K,V>[] table;
//HashMap中元素个数
transient int size;
HashMap添加元素回调用put方法,而put方法内部又调用了putVal方法:
public V put(K key, V value) {
//调用putVal方法
return putVal(hash(key), key, value, false, true);
}
putVal()是HashMap添加元素的核心:
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
//判断哈希表是否为空
if ((tab = table) == null || (n = tab.length) == 0)
//扩容
n = (tab = resize()).length;
if ((p = tab[i = (n - 1) & hash]) == null)//判断tab[i]是否有元素
//如果没有元素则直接存放
tab[i] = newNode(hash, key, value, null);
else {
Node<K,V> e; K k;
//判断和已有节点的key是否相等
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
//如果key相等则替换
e = p;
//如果key不相等,判断哈希表已有的节点是不是红黑树
else if (p instanceof TreeNode)
//如果是红黑树则以树的方式插入元素
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
//如果不是红黑树则说明这里链表,遍历链表
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
//如果链表长度大于等于7,则进制红黑树转换相关工作
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
//如果key相等则在链表中替换
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
}
}
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
//如果元素个数大于临界值则扩容
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
方法过程可以描述为:
- 判断底层hash表是否为空,如果为空则先扩容。
- 如果不为空,根据元素的key计算在hash表中的位置。
- 判断计算出的位置有无元素,如果无元素则直接放入hash表,并直接跳到第9步。
- 如果计算出的位置有元素,判断key是否相等,如果相等就直接赋值。
- 如果计算出的位置有元素,但key不相等,判断此处是否为红黑树,如果是红黑树则以树的方式插入。
- 如果计算出的位置有元素,但key不相等,不是红黑树,说明此处为链表,遍历链表准备插入。
- 如果遍历链表如果新增的元素和链表中的元素key相等则替换,如果新增元素与链表中已有元素key都不相等,则在已有元素末尾链表插入。
- 如果链表长度大于8,判断hash表容量是否大于64,如果大于64则转换成红黑树,并以红黑树的方式插入元素。
- 添加元素后判断元素个数是否大于扩容阈值,如果大于则扩容。
HashMap实际是一个数组,当两个元素的hash值相等时(hash冲突),如果key也相等,则修改原先的值(也称值覆盖),如果key不相等,就会产生链表。
链表的第一位(索引为0)是第一个出现hash冲突的元素,当这个链表的长度大于等于7的时候,进入 treeifyBin(tab, hash)制红黑树转换相关工作。
执行treeifyBin(tab, hash),若数组的长度小于64,则执行resize()扩容,16->32。当下一次put元素时,再次执行resize()扩容,32->64。
满足链表长度大于8,数组长度大于等于64,将链表转化为红黑树。
HashMap扩容流程
final Node<K,V>[] resize() {
//获取原有hash表
Node<K,V>[] oldTab = table;
//获取原容量
int oldCap = (oldTab == null) ? 0 : oldTab.length;
//获取原阈值
int oldThr = threshold;
int newCap, newThr = 0;
//如果原容量大于0
if (oldCap > 0) {
//如果原容量已经大于最大容量则不再扩容
if (oldCap >= MAXIMUM_CAPACITY) {
threshold = Integer.MAX_VALUE;
return oldTab;
}
//如果原容量的2倍小于最大容量,并且原容量小于默认容量10,就将扩容阈值修改为原阈值的2倍
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
oldCap >= DEFAULT_INITIAL_CAPACITY)
newThr = oldThr << 1; // double threshold
}
//如果当前hash表没有数据,则使用初始化的值
else if (oldThr > 0) // initial capacity was placed in threshold
newCap = oldThr;
//如果是第一次添加元素则使用默认容量16,扩容阈值为16*0.75=12
else { // zero initial threshold signifies using defaults
newCap = DEFAULT_INITIAL_CAPACITY;
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
}
if (newThr == 0) {
float ft = (float)newCap * loadFactor;
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
(int)ft : Integer.MAX_VALUE);
}
threshold = newThr;
@SuppressWarnings({"rawtypes","unchecked"})
//创建新的hash表
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
table = newTab;
if (oldTab != null) {
//遍历hash表开始扩容
for (int j = 0; j < oldCap; ++j) {
Node<K,V> e;
//如果原数据不为空,则将原数据复制到新数组
if ((e = oldTab[j]) != null) {
oldTab[j] = null;
//如果链表只有一个节点,则直接复制
if (e.next == null)
newTab[e.hash & (newCap - 1)] = e;
//如果元数据是红黑树
else if (e instanceof TreeNode)
//进行红黑树相关操作
((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
else { // preserve order
//链表复制操作
Node<K,V> loHead = null, loTail = null;
Node<K,V> hiHead = null, hiTail = null;
Node<K,V> next;
do {
next = e.next;
if ((e.hash & oldCap) == 0) {
if (loTail == null)
loHead = e;
else
loTail.next = e;
loTail = e;
}
else {
if (hiTail == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
} while ((e = next) != null);
if (loTail != null) {
loTail.next = null;
newTab[j] = loHead;
}
if (hiTail != null) {
hiTail.next = null;
newTab[j + oldCap] = hiHead;
}
}
}
}
}
return newTab;
}
- 调用无参构造器时,实例化的HashMap底层数组是null,当第一次调用put()方法时进行扩容,初始容量为16。
- 调用有参构造指定了容量和负载因子时,会根据指定的正整数找到不小于指定容量的2的次幂,将这个数赋值给扩容阈值(threshold),当第一次put()方法时,会将阈值赋值给容量,并计算新的阈值=容量x负载因子。
- 如果不是第一次扩容,则容量变为原容量的2倍,阈值也变为原来的2倍。
JDK1.7和JDK1.8中HashMap的区别:
JDK1.7的HashMap是用数组+链表实现的,采用头插法,可能产生死循环。
JDK1.8的HashMap是用数组+链表+红黑树实现的,采用尾插法,当链表长度大于8并且数组长度大于64时,会将链表转化为红黑树,如果链表长度已经为8,但是数组长度小于64时,会先扩容;当红黑树的节点数小于6时会退化成链表。
HashMap的遍历方式
- 获取keySet()后遍历keySet()获取到key然后通过key获取value
- 获取entrySet()后遍历entrySet(),相比于第一种写法稍显复杂,但是能更好的体现Map中的数据结构
- 使用Lambda表达式遍历,相比前两种是最简洁的方式,但是代码可读性略差
public static void main(String[] args) {
Map<String,String> map = new HashMap<>();
map.put("张三", "计算机科学与技术");
map.put("李四", "软件工程");
map.put("王五", "网络工程");
//第一种:获取keySet()并遍历
Set<String> set = map.keySet();
//获取迭代器
Iterator<String> it = set.iterator();
while(it.hasNext()) {
String key = it.next();
String value = map.get(key);
System.out.println(key+"==================="+value);
}
for (; it.hasNext();) {
String key = it.next();
String value = map.get(key);
System.out.println(key+"==================="+value);
}
for (String key : set) {
String value = map.get(key);
System.out.println(key+"==================="+value);
}
//第二种:获取Entry
Set<Map.Entry<String, String>> entrySet = map.entrySet();
//使用迭代器
Iterator<Map.Entry<String, String>> entryIt = entrySet.iterator();
while (entryIt.hasNext()) {
Map.Entry<String, String> entry = entryIt.next();
String key = entry.getKey();
String value = entry.getValue();
System.out.println(key+"==================="+value);
}
for (; entryIt.hasNext();) {
Map.Entry<String, String> entry = entryIt.next();
String key = entry.getKey();
String value = entry.getValue();
System.out.println(key+"==================="+value);
}
for (Entry<String, String> entry : entrySet) {
String key = entry.getKey();
String value = entry.getValue();
System.out.println(key+"==================="+value);
}
//第三种:Lambda表达式
map.forEach((key,value)->System.out.println(key+"==================="+value));
}
HashMap和Hashtable的区别:
都是Map接口的实现。
Hashtable是线程安全的,HashMap是非线程安全的,HashMap比Hashtable效率更高,多个线程访问同一个Map对象时建议使用Hashtable。
Hashtable不能使用null作为key和value,如果使用,回抛出NullPointerException空指针异常;HashMap则可以使用null作为key和value。
HashMap初始长度为16,扩容为原长度的2倍,Hashtable初始长度为11,扩容为原长度的2n+1倍。