第1章-003节

hash()与indexFor()
1.1 hash()⽅法
在get和put的过程中,计算下标时,先对hashCode进⾏hash操作,然后再通过hash值进⼀步计
算下标,如下图所示:
图片说明
图片说明
在对hashCode()计算hash时具体实现是这样的:
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
按位取并,作⽤上相当于取模mod或者取余%。这意味着数组下标相同,并不表示hashCode相
同。
可以看到这个函数⼤概的作⽤就是:⾼16bit不变,低16bit和⾼16bit做了⼀个异或。其中代码注
释是这样写的:
Computes key.hashCode() and spreads (XORs) higher bits of hash to lower. Because the
table uses power-of-two masking, sets of hashes that vary only in bits above the current
mask will always collide. (Among known examples are sets of Float keys holding
consecutive whole numbers in small tables.) So we apply a transform that spreads the
impact of higher bits downward. There is a tradeoff between speed, utility, and quality of
bit-spreading. Because many common sets of hashes are already reasonably distributed
(so don’t benefit from spreading), and because we use trees to handle large sets of
collisions in bins, we just XOR some shifted bits in the cheapest possible way to reduce
systematic lossage, as well as to incorporate impact of the highest bits that would
otherwise never be used in index calculations because of table bounds.
1.2 indexFor()⽅法
在设计hash函数时,因为⽬前的table⻓度length n为2的幂,⽽计算下标的时候,是这样实现的
(使⽤&位操作,⽽⾮%求余):
static int indexFor(int h, int n) {
return h & (n-1);
}
设计者认为这⽅法很容易发⽣碰撞。为什么这么说呢?不妨思考⼀下,在n - 1为15(0x1111)时,
其实散列真正⽣效的只是低4bit的有效位,当然容易碰撞了。
因此,设计者想了⼀个顾全⼤局的⽅法(综合考虑了速度、作⽤、质量),就是把⾼16bit和低16bit
异或了⼀下。设计者还解释到因为现在⼤多数的hashCode的分布已经很不错了,就算是发⽣了
碰撞也⽤O(logn)的tree去做了。仅仅异或⼀下,既减少了系统的开销,也不会造成的因为⾼位没
有参与下标的计算(table⻓度⽐较⼩时),从⽽引起的碰撞。
如果还是产⽣了频繁的碰撞,会发⽣什么问题呢?作者注释说,他们使⽤树来处理频繁的碰撞
(we use trees to handle large sets of collisions in bins),在JEP-180中,描述了这个问题:
Improve the performance of java.util.HashMap under high hash-collision conditions by
using balanced trees rather than linked lists to store map entries. Implement the same
improvement in the LinkedHashMap class.
之前已经提过,在获取HashMap的元素时,基本分两步:

  • ⾸先根据hashCode()做hash,然后确定bucket的index;
  • 如果bucket的节点的key不是我们需要的,则通过keys.equals()在链中找。
    在Java 8之前的实现中是⽤链表解决冲突的,在产⽣碰撞的情况下,进⾏get时,两步的时间复
    杂度是O(1)+O(n)。因此,当碰撞很厉害的时候n很⼤,O(n)的速度显然是影响速度的。
    因此在Java 8中,利⽤红⿊树替换链表,这样复杂度就变成了O(1)+O(logn)了,这样在n很⼤的时
    候,能够⽐较理想的解决这个问题,在Java 8:HashMap的性能提升⼀⽂中有性能测试的结果。
    大家一起学习丫~
java集合学习 文章被收录于专栏

主要讲解java集合相关的概念、原理和部分面试题。 共计11章。 不断更新中。。。 (摘自某大佬)

全部评论

相关推荐

刚刷到字节跳动官方发的消息,确实被这波阵仗吓了一跳。在大家还在纠结今年行情是不是又“寒冬”的时候,字节直接甩出了史上规模最大的转正实习计划——ByteIntern。咱们直接看几个最硬的数,别被花里胡哨的宣传词绕晕了。首先是“量大”。全球招7000多人是什么概念?这几乎是把很多中型互联网公司的总人数都给招进来了。最关键的是,这次的资源分配非常精准:研发岗给了4800多个Offer,占比直接超过六成。说白了,字节今年还是要死磕技术,尤其是产品和AI领域,这对于咱们写代码的同学来说,绝对是今年最厚的一块肥肉。其次是大家最关心的“转正率”。官方直接白纸黑字写了:整体转正率超过50%。这意味着只要你进去了,不划水、正常干,每两个人里就有一个能直接拿校招Offer。对于2027届(2026年9月到2027年8月毕业)的同学来说,这不仅是实习,这简直就是通往大厂的快捷通道。不过,我也得泼盆冷水。坑位多,不代表门槛低。字节的实习面试出了名的爱考算法和工程实操,尤其是今年重点倾斜AI方向,如果你简历里有和AI相关的项目,优势还是有的。而且,转正率50%也意味着剩下那50%的人是陪跑的,进去之后的考核压力肯定不小。一句话总结: 27届的兄弟们,别犹豫了。今年字节这是铁了心要抢提前批的人才,现在投递就是占坑。与其等到明年秋招去千军万马挤独木桥,不如现在进去先占个工位,把转正名额攥在手里。
喵_coding:别逗了 50%转正率 仔细想想 就是转正与不转正
字节7000实习来了,你...
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务