HashMap源码怎么分析


这篇文章主要介绍“HashMap源码怎么分析”,在日常操作中,相信很多人在HashMap源码怎么分析问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”HashMap源码怎么分析”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!HashMap 主要用来存放键值对,它基于哈希表的Map接口实现,是常用的Java集合之一。JDK1.8 之前 HashMap 由 数组+链表 组成的,数组是 HashMap 的主体,链表则是主要为了解决哈希冲突而存在的(“拉链法”解决冲突).JDK1.8 以后在解决哈希冲突时有了较大的变化,当链表长度大于阈值(默认为 8)时,将链表转化为红黑树,以减少搜索时间。JDK1.8 之前 HashMap 底层是数组和链表结合在一起使用也就是链表散列。HashMap 通过 key 的 hashCode 经过扰动函数处理过后得到 hash 值,然后通过(n - 1) & hash判断当前元素存放的位置(这里的 n 指的是数组的长度),如果当前位置存在元素的话,就判断该元素与要存入的元素的 hash 值以及 key 是否相同,如果相同的话,直接覆盖,不相同就通过拉链法解决冲突。所谓扰动函数指的就是 HashMap 的 has开发云主机域名h 方法。使用 hash 方法也就是扰动函数是为了防止一些实现比较差的 hashCode() 方法 换句话说使用扰动函数之后可以减少碰撞。JDK 1.8 HashMap 的 hash 方法源码:JDK 1.8 的 hash方法 相比于 JDK 1.7 hash 方法更加简化,但是原理不变。1234567staticfinalinthash(Objectkey) {inth;// key.hashCode():返回散列值也就是hashcode// ^ :按位异或// >>>:无符号右移,忽略符号位,空位都以0补齐return(key ==null) ?: (h = key.hashCode()) ^ (h >>>16);}对比一下 JDK1.7的 HashMap 的 hash 方法源码.12345678staticint hash(int h) {// This function ensures that hashCodes that differ only by// constant multiples at each bit position have a bounded// number of collisions (approximately 8 at default load factor).h ^= (h >>>20) ^ (h >>>12);returnh ^ (h >>>7) ^ (h >>>4);}相比于 JDK1.8 的 hash 方法 ,JDK 1.7 的 hash 方法的性能会稍差一点点,因为毕竟扰动了 4 次。所谓“拉链法”就是:将链表和数组相结合。也就是说创建一个链表数组,数组中每一格就是一个链表。若遇到哈希冲突,则将冲突的值加到链表中即可。相比于之前的版本,jdk1.8在解决哈希冲突时有了较大的变化,当链表长度大于阈值(默认为8)时,将链表转化为红黑树,以减少搜索时间。类的属性:12345678910111213141516171819202122232425262728publicclassHashMapextendsAbstractMapimplementsMap, Cloneable, Serializable {// 序列号privatestaticfinallongserialVersionUID = 362498820763181265L;// 默认的初始容量是16staticfinalintDEFAULT_INITIAL_CAPACITY =14;// 最大容量staticfinalintMAXIMUM_CAPACITY =130;// 默认的填充因子staticfinalfloatDEFAULT_LOAD_FACTOR =.75f;// 当桶(bucket)上的结点数大于这个值时会转成红黑树staticfinalintTREEIFY_THRESHOLD =8;// 当桶(bucket)上的结点数小于这个值时树转链表staticfinalintUNTREEIFY_THRESHOLD =6;// 桶中结构转化为红黑树对应的table的最小大小staticfinalintMIN_TREEIFY_CAPACITY =64;// 存储元素的数组,总是2的幂次倍transientNode[] table;// 存放具体元素的集transientSet> entrySet;// 存放元素的个数,注意这个不等于数组的长度。transientintsize;// 每次扩容和更改map结构的计数器transientintmodCount;// 临界值 当实际大小(容量*填充因子)超过临界值时,会进行扩容intthreshold;// 填充因子finalfloatloadFactor;}loadFactor加载因子loadFactor加载因子是控制数组存放数据的疏密程度,loadFactor越趋近于1,那么 数组中存放的数据(entry)也就越多,也就越密,也就是会让链表的长度增加,load Factor越小,也就是趋近于0,loadFactor太大导致查找元素效率低,太小导致数组的利用率低,存放的数据会很分散。loadFactor的默认值为0.75f是官方给出的一个比较好的临界值。thresholdthreshold = capacity * loadFactor,当Size>=threshold的时候,那么就要考虑对数组的扩增了,也就是说,这个的意思就是衡量数组是否需要扩增的一个标准。Node节点类源码:123456789101112131415161718192021222324252627282930313233343536373839// 继承自 Map.EntrystaticclassNodeimplementsMap.Entry {finalinthash;// 哈希值,存放元素到hashmap中时用来与其他元素hash值比较finalK key;//键V value;//值// 指向下一个节点Node next;Node(inthash, K key, V value, Node next) {this.hash = hash;this.key = key;this.value = value;this.next = next;}publicfinalK getKey() {returnkey; }publicfinalV getValue() {returnvalue; }publicfinalString toString() {returnkey +"="+ value; }// 重写hashCode()方法publicfinalinthashCode() {returnObjects.hashCode(key) ^ Objects.hashCode(value);}publicfinalV setValue(V newValue) {V oldValue = value;value = newValue;returnoldValue;}// 重写 equals() 方法publicfinalbooleanequals(Object o) {if(o ==this)returntrue;if(oinstanceofMap.Entry) {Map.Entry,?> e = (Map.Entry,?>)o;if(Objects.equals(key, e.getKey()) &&Objects.equals(value, e.getValue()))returntrue;}returnfalse;}}树节点类源码:12345678910111213141516staticfinalclassTreeNodeextendsLinkedHashMap.Entry {TreeNode parent;// 父TreeNode left;// 左TreeNode right;// 右TreeNode prev;// needed to unlink next upon deletionbooleanred;// 判断颜色TreeNode(inthash, K key, V val, Node next) {super(hash, key, val, next);}// 返回根节点finalTreeNode root() {for(TreeNode r =this, p;;) {if((p = r.parent) ==null)returnr;r = p;}123456789101112131415161718192021222324252627// 默认构造函数。publicMore ...HashMap() {this.loadFactor = DEFAULT_LOAD_FACTOR;// all other fields defaulted}// 包含另一个“Map”的构造函数publicMore ...HashMap(MapextendsK, ?extendsV> m) {this.loadFactor = DEFAULT_LOAD_FACTOR;putMapEntries(m,false);//下面会分析到这个方法}// 指定“容量大小”的构造函数publicMore ...HashMap(intinitialCapacity) {this(initialCapacity, DEFAULT_LOAD_FACTOR);}// 指定“容量大小”和“加载因子”的构造函数publicMore ...HashMap(intinitialCapacity,floatloadFactor) {if(initialCapacity )thrownewIllegalArgumentException("Illegal initial capacity: "+ initialCapacity);if(initialCapacity > MAXIMUM_CAPACITY)initialCapacity = MAXIMUM_CAPACITY;if(loadFactor || Float.isNaN(loadFactor))thrownewIllegalArgumentException("Illegal load factor: "+ loadFactor);this.loadFactor = loadFactor;this.threshold = tableSizeFor(initialCapacity);}putMapEntries方法:123456789101112131415161718192021222324finalvoidputMapEntries(MapextendsK, ?extendsV> m,booleanevict) {ints = m.size();if(s >) {// 判断table是否已经初始化if(table ==null) {// pre-size// 未初始化,s为m的实际元素个数floatft = ((float)s / loadFactor) +1.0F;intt = ((ft float)MAXIMUM_CAPACITY) ?(int)ft : MAXIMUM_CAPACITY);// 计算得到的t大于阈值,则初始化阈值if(t > threshold)threshold = tableSizeFor(t);}// 已初始化,并且m元素个数大于阈值,进行扩容处理elseif(s > threshold)resize();// 将m中的所有元素添加至HashMap中for(Map.EntryextendsK, ?extendsV> e : m.entrySet()) {K key = e.getKey();V value = e.getValue();putVal(hash(key), key, value,false, evict);}}}HashMap只提供了put用于添加元素,putVal方法只是给put方法调用的一个方法,并没有提供给用户使用。对putVal方法添加元素的分析如下:①如果定位到的数组位置没有元素 就直接插入。②如果定位到的数组位置有元素就和要插入的 key 比较,如果key相同就直接覆盖,如果 key 不相同,就判断 p 是否是一个树节点,如果是就调用e = ((TreeNode)p).putTreeVal(this, tab, hash, key, value)将元素添加进入。如果不是就遍历链表插入。1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162636465666768697071publicV put(K key, V value) {returnputVal(hash(key), key, value,false,true);}finalV putVal(inthash, K key, V value,booleanonlyIfAbsent,booleanevict) {Node[] tab; Node p;intn, i;// table未初始化或者长度为0,进行扩容if((tab = table) ==null|| (n = tab.length) ==)n = (tab = resize()).length;// (n - 1) & hash 确定元素存放在哪个桶中,桶为空,新生成结点放入桶中(此时,这个结点是放在数组中)if((p = tab[i = (n -1) & hash]) ==null)tab[i] = newNode(hash, key, value,null);// 桶中已经存在元素else{Node e; K k;// 比较桶中第一个元素(数组中的结点)的hash值相等,key相等if(p.hash == hash &&((k = p.key) == key || (key !=null&& key.equals(k))))// 将第一个元素赋值给e,用e来记录e = p;// hash值不相等,即key不相等;为红黑树结点elseif(pinstanceofTreeNode)// 放入树中e = ((TreeNode)p).putTreeVal(this, tab, hash, key, value);// 为链表结点else{// 在链表最末插入结点for(intbinCount =; ; ++binCount) {// 到达链表的尾部if((e = p.next) ==null) {// 在尾部插入新结点p.next = newNode(hash, key, value,null);// 结点数量达到阈值,转化为红黑树if(binCount >= TREEIFY_THRESHOLD -1)// -1 for 1sttreeifyBin(tab, hash);// 跳出循环break;}// 判断链表中结点的key值与插入的元素的key值是否相等if(e.hash == hash &&((k = e.key) == key || (key !=null&& key.equals(k))))// 相等,跳出循环break;// 用于遍历桶中的链表,与前面的e = p.next组合,可以遍历链表p = e;}}// 表示在桶中找到key值、hash值与插入元素相等的结点if(e !=null) {// 记录e的valueV oldValue = e.value;// onlyIfAbsent为false或者旧值为nullif(!onlyIfAbsent || oldValue ==null)//用新值替换旧值e.value = value;// 访问后回调afterNodeAccess(e);// 返回旧值returnoldValue;}}// 结构性修改++modCount;// 实际大小大于阈值则扩容if(++size > threshold)resize();// 插入后回调afterNodeInsertion(evict);returnnull;}我们再来对比一下 JDK1.7 put方法的代码对于put方法的分析如下:①如果定位到的数组位置没有元素 就直接插入。②如果定位到的数组位置有元素,遍历以这个元素为头结点的链表,依次和插入的key比较,如果key相同就直接覆盖,不同就采用头插法插入元素。12345678910111213141516171819202122publicV put(K key, V value)if(table == EMPTY_TABLE) {inflateTable(threshold);}if(key ==null)returnputForNullKey(value);inthash = hash(key);inti = indexFor(hash, table.length);for(Entry e = table[i]; e !=null; e = e.next) {// 先遍历Object k;if(e.hash == hash && ((k = e.key) == key || key.equals(k))) {V oldValue = e.value;e.value = value;e.recordAccess(this);returnoldValue;}}modCount++;addEntry(hash, key, value, i);// 再插入returnnull;}12345678910111213141516171819202122232425262728publicV get(Object key) {Node e;return(e = getNode(hash(key), key)) ==null?null: e.value;}finalNode getNode(inthash, Object key) {Node[] tab; Node first, e;intn; K k;if((tab = table) !=null&& (n = tab.length) >&&(first = tab[(n -1) & hash]) !=null) {// 数组元素相等if(first.hash == hash &&// always check first node((k = first.key) == key || (key !=null&& key.equals(k))))returnfirst;// 桶中不止一个节点if((e = first.next) !=null) {// 在树中getif(firstinstanceofTreeNode)return((TreeNode)first).getTreeNode(hash, key);// 在链表中getdo{if(e.hash == hash &&((k = e.key) == key || (key !=null&& key.equals(k))))returne;}while((e = e.next) !=null);}}returnnull;}进行扩容,会伴随着一次重新hash分配,并且会遍历hash表中所有的元素,是非常耗时的。在编写程序中,要尽量避免resize。1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162636465666768697071727374757677787980finalNode[] resize() {Node[] oldTab = table;intoldCap = (oldTab ==null) ?: oldTab.length;intoldThr = threshold;intnewCap, newThr =;if(oldCap >) {// 超过最大值就不再扩充了,就只好随你碰撞去吧if(oldCap >= MAXIMUM_CAPACITY) {threshold = Integer.MAX_VALUE;returnoldTab;}// 没超过最大值,就扩充为原来的2倍elseif((newCap = oldCap 1) = DEFAULT_INITIAL_CAPACITY)newThr = oldThr 1;// double threshold}elseif(oldThr >)// initial capacity was placed in thresholdnewCap = oldThr;else{signifies using defaultsnewCap = DEFAULT_INITIAL_CAPACITY;newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);}// 计算新的resize上限if(newThr ==) {floatft = (float)newCap * loadFactor;newThr = (newCap float)MAXIMUM_CAPACITY ? (int)ft : Integer.MAX_VALUE);}threshold = newThr;@SuppressWarnings({"rawtypes","unchecked"})Node[] newTab = (Node[])newNode[newCap];table = newTab;if(oldTab !=null) {// 把每个bucket都移动到新的buckets中for(intj =; j Node e;if((e = oldTab[j]) !=null) {oldTab[j] =null;if(e.next ==null)newTab[e.hash & (newCap -1)] = e;elseif(einstanceofTreeNode)((TreeNode)e).split(this, newTab, j, oldCap);else{Node loHead =null, loTail =null;Node hiHead =null, hiTail =null;Node next;do{next = e.next;// 原索引if((e.hash & oldCap) ==) {if(loTail ==null)loHead = e;elseloTail.next = e;loTail = e;}// 原索引+oldCapelse{if(hiTail ==null)hiHead = e;elsehiTail.next = e;hiTail = e;}}while((e = next) !=null);// 原索引放到bucket里if(loTail !=null) {loTail.next =null;newTab[j] = loHead;}// 原索引+oldCap放到bucket里if(hiTail !=null) {hiTail.next =null;newTab[j + oldCap] = hiHead;}}}}}returnnewTab;}12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970packagemap;importjava.util.Collection;importjava.util.HashMap;importjava.util.Set;publicclassHashMapDemo {publicstaticvoidmain(String[] args) {HashMap map =newHashMap();// 键不能重复,值可以重复map.put("san","张三");map.put("si","李四");map.put("wu","王五");map.put("wang","老王");map.put("wang","老王2");// 老王被覆盖map.put("lao","老王");System.out.println("-------直接输出hashmap:-------");System.out.println(map);/*** 遍历HashMap*/// 1.获取Map中的所有键System.out.println("-------foreach获取Map中所有的键:------");Set keys = map.keySet();for(String key : keys) {System.out.print(key+" ");}System.out.println();//换行// 2.获取Map中所有值System.out.println("-------foreach获取Map中所有的值:------");Collection values = map.values();for(String value : values) {System.out.print(value+" ");}System.out.println();//换行// 3.得到key的值的同时得到key所对应的值System.out.println("-------得到key的值的同时得到key所对应的值:-------");Set keys2 = map.keySet();for(String key : keys2) {System.out.print(key +":"+ map.get(key)+" ");}/*** 另外一种不常用的遍历方式*/// 当我调用put(key,value)方法的时候,首先会把key和value封装到// Entry这个静态内部类对象中,把Entry对象再添加到数组中,所以我们想获取// map中的所有键值对,我们只要获取数组中的所有Entry对象,接下来// 调用Entry对象中的getKey()和getValue()方法就能获取键值对了Set> entrys = map.entrySet();for(java.util.Map.Entry entry : entrys) {System.out.println(entry.getKey() +"--"+ entry.getValue());}/*** HashMap其他常用方法*/System.out.println("after map.size():"+map.size());System.out.println("after map.isEmpty():"+map.isEmpty());System.out.println(map.remove("san"));System.out.println("after map.remove():"+map);System.out.println("after map.get(si):"+map.get("si"));System.out.println("after map.containsKey(si):"+map.containsKey("si"));System.out.println("after containsValue(李四):"+map.containsValue("李四"));System.out.println(map.replace("si","李四2"));System.out.println("after map.replace(si, 李四2):"+map);}}到此,关于“HashMap源码怎么分析”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注开发云网站,小编会继续努力为大家带来更多实用的文章!

相关推荐: 程序员的主要工作

程序员的主要工作应该是:程序的应用逻辑设计及设计后相关代码的编写。做项目时现有一个大概的逻辑设计,然后开始编写代码,在编写代码的时候,会不断调整以前的逻辑设计和增加新的逻辑设计。项目完成后测试阶段会根据用户体验再调整逻辑设计和相关程序代开发云主机域名码。软件开…

免责声明:本站发布的图片视频文字,以转载和分享为主,文章观点不代表本站立场,本站不承担相关法律责任;如果涉及侵权请联系邮箱:360163164@qq.com举报,并提供相关证据,经查实将立刻删除涉嫌侵权内容。

(0)
打赏 微信扫一扫 微信扫一扫
上一篇 05/13 16:10
下一篇 05/13 16:10