、烟雨

2022-07-28 20:21 广州大学 Java

关注

手写HashMap，快手面试官直呼内行！

这……我当时就麻了，我们都知道HashMap的数据结构是数组+链表+红黑树，这是要手撕红黑树的节奏吗？

后来，整理了一些面经，发现这道题在快手的面试出现还比较频繁，分析这道题应该在快手的面试题库。那既然频繁出，肯定不能是手撕红黑树——我觉得面试官也多半撕不出来，不撕红黑树，那这道题还有点救，慢慢往下看。

认识哈希表

HashMap其实是数据结构中的哈希表在Java里的实现。

哈希表本质

哈希表也叫散列表，我们先来看看哈希表的定义：

哈希表是根据关键码的值而直接进行访问的数据结构。

就像有人到公司找老三，前台小姐姐拿手一指，那个墙角的工位就是。

简单说来说，哈希表由两个要素构成：桶数组和散列函数。

桶数组：一排工位
散列函数：老三在墙角

桶数组

我们可能知道，有一类基础的数据结构线性表，而线性表又分两种，数组和链表。

哈希表数据结构里，存储元素的数据结构就是数组，数组里的每个单元都可以想象成一个桶（Bucket）。

假如给若干个程序员分配工位：蛋蛋、熊大、牛儿、张三，我们观察到，这些名字比较有特色，最后一个字都是数字，我们可以把它提取出来作为关键码，这些一来，就可以把他们分配到对应编号的工位，没分配到的工位就让它先空着。

那么在这种情况下，我们查找/插入/删除的时间复杂度是多少呢？很明显，都是O(1)。

但咱们也不是葫芦娃，名字不能都叫一二三四五六七之类的，假如来的新人叫南宫大牛，那我们怎么分配他呢？

这就引入了我们的第二个关键要素——散列函数。

散列函数

我们需要在元素和桶数组对应位置建立一种映射映射关系，这种映射关系就是散列函数，也可以叫哈希函数。

例如，我们一堆无规律的名字诸葛钢铁、刘华强、王司徒、张全蛋……我们就需要通过散列函数，算出这些名字应该分配到哪一号工位。

散列函数构造

散列函数也叫哈希函数，假如我们数据元素的key是整数或者可以转换为一个整数，可以通过这些常见方法来获取映射地址。

直接定址法

直接根据key来映射到对应的数组位置，例如1232放到下标1232的位置。
数字分析法

取key的某些数字（例如十位和百位）作为映射的位置
平方取中法

取key平方的中间几位作为映射的位置
折叠法

将key分割成位数相同的几段，然后把它们的叠加和作为映射的位置
除留余数法

H（key)=key%p（p<=N）,关键字除以一个不大于哈希表长度的正整数p，所得余数为哈希地址，这是应用最广泛的散列函数构造方法。

在Java里，Object类里提供了一个默认的hashCode()方法，它返回的是一个32位int形整数，其实也就是对象在内存里的存储地址。

但是，这个整数肯定是要经过处理的，上面几种方法里直接定址法可以排除，因为我们不可能建那么大的桶数组。

而且我们最后计算出来的散列地址，尽可能要在桶数组长度范围之内，所以我们选择除留取余法。

哈希冲突

理想的情况，是每个数据元素经过哈希函数的计算，落在它独属的桶数组的位置。

但是现实通常不如人意，我们的空间是有限的，设计再好的哈希函数也不能完全避免哈希冲突。所谓的哈希冲突，就是不同的key经过哈希函数计算，落到了同一个下标。

既然有了冲突，就得想办法解决冲突，常见的解决哈希冲突的办法有：

链地址法

也叫拉链法，看起来，像在桶数组上再拉一个链表出来，把发生哈希冲突的元素放到一个链表里，查找的时候，从前往后遍历链表，找到对应的key就行了。

开放地址法

开放地址法，简单来说就是给冲突的元素再在桶数组里找到一个空闲的位置。

找到空闲位置的方法有很多种：

线行探查法: 从冲突的位置开始，依次判断下一个位置是否空闲，直至找到空闲位置
平方探查法: 从冲突的位置x开始，第一次增加1^2个位置，第二次增加2^2...，直至找到空闲的位置
双散列函数探查法

再哈希法

构造多个哈希函数，发生冲突时，更换哈希函数，直至找到空闲位置。

建立公共溢出区

建立公共溢出区，把发生冲突的数据元素存储到公共溢出区。

很明显，接下来我们解决冲突，会使用链地址法。

好了，哈希表的介绍就到这，相信你已经对哈希表的本质有了深刻的理解，接下来，进入coding时间。

HashMap实现

我们实现的简单的HashMap命名为ThirdHashMap，先确定整体的设计：

散列函数：hashCode()+除留余数法
冲突解决：链地址法

整体结构如下：

内部节点类

我们需要定义一个节点来作为具体数据的载体，它不仅要承载键值对，同样还得作为单链表的节点：

成员变量

主要有四个成员变量，其中桶数组作为装载数据元素的结构：

构造方法

构造方法有两个，无参构造方法，桶数组默认容量，有参指定桶数组容量。

散列函数

散列函数，就是我们前面说的hashCode()和数组长度取余。

put方法

我用了一个putval方法来完成实际的逻辑，这是因为扩容也会用到这个方法。

大概的逻辑：

获取元素插入位置
当前位置为空，直接插入
位置不为空，发生冲突，遍历链表
如果元素key和节点相同，覆盖，否则新建节点插入链表头部

扩容方法

扩容的大概过程：

创建两倍容量的新数组
将当前桶数组的元素重新散列到新的数组
新数组置为map的桶数组

get方法

get方法就比较简单，通过散列函数获取地址，这里我省去了有没有成链表的判断，直接查找链表。

完整代码：

测试

测试代码如下：

大家可以自行跑一下看看结果。

总结

好了，到这，我们一个简单的HashMap就实现了，这下，面试快手再也不怕手写HashMap了。

快手面试官：真的吗？我不信。我就要你手写个红黑树版的……

当然了，我们也发现，HashMap的O(1)时间复杂度操作是在冲突比较少的情况下，简单的哈希取余肯定不是最优的散列函数；冲突之后，链表拉的太长，同样影响性能；我们的扩容和put其实也存在线程安全的问题……

但是，现实里我们不用考虑那么多，因为李老爷已经帮我们写好了，我们只管调用就完了。

#Java开发##后端开发##面试##Java找工作##读书笔记#

全部评论

推荐最新楼层

从入门到放弃201909032251189

美团_java后端开发

还好吧，去年秋招就写过一次

1 回复分享

发布于 2022-07-28 21:44

mona110

深圳大学设计师助理

什么岗

点赞回复分享

发布于 2022-08-04 12:00

11-18 22:59

暨南大学 HRBP

现在的同学找工作的想法真的很多

今天面试了一个00后的小女生，她对找工作的想法让我深有感触。她提到，除了基本工资，她希望公司能抗风险，稳定可靠。更重要的是，她渴望在这个平台上成长，而不是仅仅打卡上班，浪费时间。她说得对，大家其实都是在为未来的简历而努力。无论年龄，能清楚自己想要什么，选择手中拥有的机会，践行长期主义，才是最珍贵的。积极的态度和行动，才是我们求职路上最宝贵的财富。

牛客创作赏金赛

点赞评论收藏

11-20 17:40

西安邮电大学有线传输工程师

喳

工作几年后，已经慢慢开始感觉只回“收到”太生硬了，目前已经开始回“好嘞”。不仅为对方提供了情绪价值，而且真情实感到有种奴才说“喳”的逢迎感。

点赞评论收藏

今天 00:40

美团_后端开发(准入职员工)

忙完了工作，又要毕业论文……

工作基本定了，比较满意。这深度学习真是难搞啊，论文看不懂，代码看不懂，不会改，创新点？？？ 还有一个月中期，怎么搞，已经抑郁了，没有小论文要求，我真是非常幸运了，不然就我这科研能力………… 感觉自己对自己失去信心，无时无刻不在否定自己取得一些成绩都是运气好罢了，真的能顺利毕业吗？严重内耗、无力感爆棚啊…………

你们的毕业论文什么进度了牛客解忧铺

点赞评论收藏

5 41 评论

招聘动态

杉川机器人

2025校园招聘

字节跳动

2025校园招聘

字节跳动Data

2025校园招聘

快手Star

2025届招聘

快手

销售类投递专区

库洛游戏

全站热榜

正在热议

# 选完offer后，你后悔学本专业吗 #

# 没有合适的工作，你会先找个干着，还是考公考研 #

35295次浏览 392人参与

# 秋招OC许愿 #

224012次浏览 1854人参与

# 如果能重来，就业or读研你选哪个？ #