前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Hash表(四)——Hash冲突解决办法&HashMap分析

Hash表(四)——Hash冲突解决办法&HashMap分析

作者头像
用户3470542
发布2019-08-27 09:56:03
2.6K0
发布2019-08-27 09:56:03
举报
文章被收录于专栏:算法半岛算法半岛算法半岛

1 合理选择 Hash冲突解决办法

Hash表(二)——散列冲突中学到常用的解决 Hash冲突的方法有开放寻址法和链表法。在 JavaThreadLocalMap采用线性探测的开放寻址法来解决冲突, LinkedHashMap采用了链表法解决 Hash冲突,现将开放寻址法和链表法总结如下。

1.1 开放寻址法
  • 优点:将数据存储在数组中;利用CPU缓存加快查询速度;并且序列化简单。
  • 缺点:删除数据麻烦,需要特殊标记已删除的数据;需要将所有数据存储在一个连续的存储空间中,比起链表来说,冲突的代价更高。
  • 适用场景:当数据量较小、装载因子小的时候可以采用开放寻址法。
1.2 链表法
  • 优点:对内存利用率高;对装载因子的容忍度高(开放寻址法只适用在装载因子小于1的情况,接近1时,就可能会有大量散列冲突,导致大量的探测、再散列,性能下降很多。但对于链表法,只要散列函数的值随机均匀,当装载因子大于1时,只是对应的链表长度增加,这里也可以通过将链表改造为跳表或者红黑树的方式加快查找速度)
  • 缺点:由于链表需要存储指针,存储较小的对象时,指针占用的内容消耗比较大;链表不支持随机查找,查找效率较低。
  • 适用场景:适合于存储大对象、数据量大的散列表;比开放寻址法更加灵活,支持更多的优化策略,如使用红黑树替代链表。
  • 优化:我们可将链表法中的链表替换成更加高效的动态的数据结构,如跳表、红黑树等。 如下图所示,将链表优化为红黑树。

2 Java中的 HashMap分析

HashMap是一个成熟的散列表,在Java中得到了广泛应用,下面来具体分析。

2.1 初始大小

如下图所示, HashMap默认的初始大小为16。

如果事先知道数据量的大小,可以通过修改初始大小,减少动态扩容次数,来提升 HashMap性能。

2.2 装载因子和动态扩容

如下图所示, HashMap默认的装载因子为0.75。

HashMap中元素个数超过 0.75*capacitycapacity表示 HashMap实际的容量),就会启动动态扩容,每次扩容的大小为原来的两倍。

2.3 Hash冲突的解决办法

JDK1.8之前, HashMap底层采用的链表法来解决冲突。即使装载因子和 Hash函数设计的再合理,随着数据量的增加也会出现链表过长的情况,一旦链表过长,严重影响了 HashMap的性能。

JDK1.8中对 HashMap底层做了优化。当链表长度大于8时,链表就转化为红黑树,当链表小于8时,将红黑树转化为链表。因为当链表过长的时候,查找的效率将会变慢,利用红黑树快速增删改查的特性,可以提高 HashMap的性能,而链表不长时,红黑树的快速增删改查的特性就不太明显,并且红黑树的还有维护成本,因此当链表不长时,不需要将链表转化为红黑树。

2.4 Hash函数

HashMap中的 Hash函数如下图所示,追求简单高效且分布均匀。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-08-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 算法半岛 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.1 开放寻址法
  • 1.2 链表法
  • 2.1 初始大小
  • 2.2 装载因子和动态扩容
  • 2.3 Hash冲突的解决办法
  • 2.4 Hash函数
相关产品与服务
数据保险箱
数据保险箱(Cloud Data Coffer Service,CDCS)为您提供更高安全系数的企业核心数据存储服务。您可以通过自定义过期天数的方法删除数据,避免误删带来的损害,还可以将数据跨地域存储,防止一些不可抗因素导致的数据丢失。数据保险箱支持通过控制台、API 等多样化方式快速简单接入,实现海量数据的存储管理。您可以使用数据保险箱对文件数据进行上传、下载,最终实现数据的安全存储和提取。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档