查看完整视频
小黑屋思过中,禁止观看!
评论并刷新后可见

您需要在视频最下面评论并刷新后,方可查看完整视频

积分观看

您支付积分,方可查看完整视频

{{user.role.value}}
付费视频

您支付费用,方可查看完整视频

¥{{user.role.value}}
课程视频

全面深入50W+年薪技能,构建体系化架构师能力


会员专享

视频选集

HashMap源码深度剖析,大厂面试必看!

  • 课程笔记
  • 问答交流

一线资深java工程师招聘需求里明确了需要精通集合容器,尤其是今天我谈到的HashMap以及后续我要讲到的ConcurrentHashMap

HashMap在Java集合的重要性不亚于Volatile在并发编程的重要性(可见性与有序性),所以需要重点来掌握。

为了助大家掌握好HashMap,这节课我会重点讲解以下10点:

1.HashMap的数据结构

2.HashMap核心成员

3.HashMapd的Node数组

4.HashMap的数据存储

5.HashMap的哈希函数

6.哈希冲突:链式哈希表

7.HashMap的get方法:哈希函数

8.HashMap的put方法

9.为什么槽位数必须使用2^n?

10.HashMap必考点总结

HashMap的数据结构

首先我们从数据结构的角度来看:HashMap是:数组+链表+红黑树(JDK1.8增加了红黑树部分)的数据结构,如下所示:

HashMap源码深度剖析,大厂面试必看!-mikechen的互联网架构师之路

这里需要搞明白两个问题:

  • 数据底层具体存储的是什么?
  • 这样的存储方式有什么优点呢?

1.核心成员

默认初始容量(数组默认大小):16,2的整数次方
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; 

 最大容量
static final int MAXIMUM_CAPACITY = 1 << 30;

默认负载因子
static final float DEFAULT_LOAD_FACTOR = 0.75f;
装载因子用来衡量HashMap满的程度,表示当map集合中存储的数据达到当前数组大小的75%则需要进行扩容
 
链表转红黑树边界
static final int TREEIFY_THRESHOLD = 8;

红黑树转离链表边界
static final int UNTREEIFY_THRESHOLD = 6;

哈希桶数组
transient Node<K,V>[] table;

实际存储的元素个数
transient int size;

当map里面的数据大于这个threshold就会进行扩容
int threshold   阈值 = table.length * loadFactor

 

2.Node数组

从源码可知,HashMap类中有一个非常重要的字段,就是 Node[] table,即哈希桶数组,明显它是一个Node的数组。

static class Node<K,V> implements Map.Entry<K,V> {
    final int hash;//用来定位数组索引位置
    final K key;
    V value;
    Node<K,V> next;//链表的下一个Node节点

    Node(int hash, K key, V value, Node<K,V> next) {
        this.hash = hash;
        this.key = key;
        this.value = value;
        this.next = next;
    }


    public final K getKey()        { return key; }
    public final V getValue()      { return value; }
    public final String toString() { return key + "=" + value; }


    public final int hashCode() {
        return Objects.hashCode(key) ^ Objects.hashCode(value);
    }


    public final V setValue(V newValue) {
        V oldValue = value;
        value = newValue;
        return oldValue;
    }


    public final boolean equals(Object o) {
        if (o == this)
            return true;
        if (o instanceof Map.Entry) {
            Map.Entry<?,?> e = (Map.Entry<?,?>)o;
            if (Objects.equals(key, e.getKey()) &&
                Objects.equals(value, e.getValue()))
                return true;
        }
        return false;
    }
}

Node是HashMap的一个内部类,实现了Map.Entry接口,本质是就是一个映射(键值对)。

HashMap的数据存储

1.哈希表来存储

HashMap采用哈希表来存储数据。

哈希表(Hash table,也叫散列表),是根据关键码值(Key value)而直接进行访问的数据结构,只要输入待查找的值即key,即可查找到其对应的值。

哈希表其实就是数组的一种扩展,由数组演化而来。可以说,如果没有数组,就没有散列表。

2.哈希函数

哈希表中元素是由哈希函数确定的,将数据元素的关键字Key作为自变量,通过一定的函数关系(称为哈希函数),计算出的值,即为该元素的存储地址。
表示为:Addr = H(key),如下图所示:
HashMap源码深度剖析,大厂面试必看!-mikechen的互联网架构师之路

哈希表中哈希函数的设计是相当重要的,这也是建哈希表过程中的关键问题之一。

3.核心问题

建立一个哈希表之前需要解决两个主要问题:

1)构造一个合适的哈希函数,均匀性 H(key)的值均匀分布在哈希表中

2)冲突的处理

冲突:在哈希表中,不同的关键字值对应到同一个存储位置的现象。

4.哈希冲突:链式哈希表

哈希表为解决冲突,可以采用地址法和链地址法等来解决问题,Java中HashMap采用了链地址法。

链地址法,简单来说,就是数组加链表的结合,如下图所示:

HashMap源码深度剖析,大厂面试必看!-mikechen的互联网架构师之路
HashMap源码深度剖析,大厂面试必看!-mikechen的互联网架构师之路

HashMap的哈希函数

/**
* 重新计算哈希值
*/
static final int hash(Object key) {
    
    int h;

     // h = key.hashCode() 为第一步 取hashCode值
     // h ^ (h >>> 16) 为第二步 高位参与运算
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

 

//计算数组槽位

(n - 1) & hash

对key进行了hashCode运算,得到一个32位的int值h,然后用h 异或 h>>>16位。在JDK1.8的实现中,优化了高位运算的算法,通过hashCode()的高16位异或低16位实现的:(h = k.hashCode()) ^ (h >>> 16)。

HashMap源码深度剖析,大厂面试必看!-mikechen的互联网架构师之路

这样做的好处是,可以将hashcode高位和低位的值进行混合做异或运算,而且混合后,低位的信息中加入了高位的信息,这样高位的信息被变相的保留了下来。

等于说计算下标时把hash的高16位也参与进来了,掺杂的元素多了,那么生成的hash值的随机性会增大,减少了hash碰撞。

备注:

  • ^异或:不同为1,相同为0
  • >>> :无符号右移:右边补0
  • &运算:两位同时为“1”,结果才为“1,否则为0

h & (table.length -1)来得到该对象的保存位,而HashMap底层数组的长度总是2的n次方。

为什么槽位数必须使用2^n?

隐藏内容,您需要满足以下条件方可查看
End

 

2 条回复 A文章作者 M管理员
  1. 路正银

    1、HashMap是用数据+链表+红黑树(JDK1.8版本之后增加)的数据结构来实现的,
    通过哈希函数确定在桶(数组)中的位置,当发生哈希冲突的时候,往后挂链表(JDK1.8版本会有链表转红黑树的逻辑)
    2、(1)底层数据结构不一样,1.7是数组+链表,1.8是数组+链表+红黑树
    (2)计算哈希值时,jdk1.8版本相比jdk1.7版本多了对hasCode做无符号右移16位,与原hasCode做异或的操作
    (3)扩容策略不一样
    3、哈希函数的目的是尽量让计算出的哈希值分布均匀,减少哈希碰撞
    JDK1.8版本的优化是,将hascode的高16位做移位操作,可以让hascode高位的值也参与运算,掺杂的元素多了,生成的hash的值的随机性会增大,减少了hash碰撞

    • mikechen

      核心点都谈到了 ,基本都掌握了,再补充一个点:就是HashMap 1.7版本在多线程的情况下会出现死循环,形成一个链表的死循环这个点,还可以线下有时间再做了解和补充,基本就没问题了。

      基本学习快一个月了,依然还在坚持输出作业,这个必须给赞 ,线下就坚持锻炼(keep见)+坚持作业输出,我就搬个小板凳在旁边给你呐喊加油了 ,继续加油 ✗咧嘴笑✗ ✗拳头✗