<span>Java数据结构与算法 day06 查找算法与哈希表</span>

文章目录

第七章查找算法
第八章哈希表

第七章查找算法

本章源码：https://github.com/name365/Java-Data-structure

线性查找分析和实现

有一个数列：{1,8, 10, 89, 1000, 1234}，判断数列中是否包含此名称【顺序查找】要求如果找到了，就提示找到，并给出下标值。

public class SeqSearch {

	public static void main(String[] args) {
		int arr[] = { 1, 9, 11, -1, 34, 89 };	//无序序列
// int arr[] = {1,8, 10, 89, 1000, 1234}; //有序序列
		
		int index = seqSearch(arr, 34);
		if(index == -1){
			System.out.println("没有找到");
		}else{
			System.out.println("找到了:" + index);
		}
	}
	
	/** * * @Description 此处实现的线性查找是找到一个满足条件的值,就返回 * @author subei * @date 2020年5月30日下午6:30:16 * @param arr * @param value * @return */
	public static int seqSearch(int[] arr,int value){
		//线性查找是逐一比对,发现相同值,返回下标
		for(int i = 0;i < arr.length;i++){
			if(arr[i] == value){
				return i;
			}
		}
		return -1;
	}
}

二分查找分析与实现

请对一个有序数组进行二分查找 {1,8, 10, 89, 1000, 1234} ，输入一个数看看该数组是否存在此数，并且求出下标，如果没有就提示"没有这个数"。

二分查找的思路分析:

1. 首先确定该数组的中间的下标
	mid = (left + right) / 2

2. 然后让需要查找的数 findVal 和 arr[mid] 比较
	2.1 findVal > arr[mid] ,  说明你要查找的数在mid 的右边, 因此需要递归的向右查找。
	2.2 findVal < arr[mid], 说明你要查找的数在mid 的左边, 因此需要递归的向左查找。
	2.3 findVal == arr[mid] 说明找到，就返回。

//什么时候我们需要结束递归.
1) 找到就结束递归。 
2) 递归完整个数组，仍然没有找到findVal ，也需要结束递归  当 left > right 就需要退出。

代码实现:

//注意:使用二分查找的数组,必须是有序的。
public class BinarySearch {

	public static void main(String[] args) {
		int arr[] = {1,8, 10, 89, 1000, 1234};
		int serch = binarySerch(arr, 0, arr.length - 1, 11);
		System.out.println("serch = " + serch);
	}
	
	/** * * @Description 二分查找算法 * @author subei * @date 2020年5月31日下午4:59:59 * @param arr 数组 * @param left 左边的索引 * @param right 右边的索引 * @param findVal 要查找的值 * @return 如果找到返回下标，反之，返回 -1 */
	public static int binarySerch(int arr[],int left,int right,int findVal){
		//当left > right时,整个数组都没有
		if(left > right){
			return -1;
		}
		int mid = (left + right) / 2;
		int midVal = arr[mid];
		if(findVal > midVal){	//向右递归
			return binarySerch(arr, mid + 1, right, findVal);
		}else if(findVal < midVal){	//向左递归
			return binarySerch(arr, left, mid-1, findVal);
		}else{
			return mid;
		}
	}
}

算法的进一步优化:

{1,8, 10, 89, 1000, 1000，1234} 当一个有序数组中，有多个相同的数值时，如何将所有的数值都查找到，比如这里的 1000.

import java.util.ArrayList;
import java.util.List;

//注意:使用二分查找的数组,必须是有序的。
public class BinarySearch2 {

	public static void main(String[] args) {
		int arr[] = {1,8, 10, 89, 1000,1000, 1234};
		
		List<Integer> reget = binarySerch2(arr, 0, arr.length - 1, 89);
		System.out.println("reget = " + reget);
	}
	
	//{1,8, 10, 89, 1000, 1000，1234} 
	//当一个有序数组中，有多个相同的数值时，如何将所有的数值都查找到，比如这里的 1000.
	//思路分析:
	//1.在找到mid时,不马上返回
	//2.向mid索引值的左边扫描,将所有满足 1000的元素的下标，加入到集合ArrayList中
	//3.向mid索引值的右边扫描,将所有满足 1000的元素的下标，加入到集合ArrayList中
	//4.返回ArrayList集合
	public static List<Integer>  binarySerch2(int arr[],int left,int right,int findVal){
		//当left > right时,整个数组都没有
		if(left > right){	//没有这个判断,会造成死递归！！！！
			return new ArrayList<Integer>();
		}
		int mid = (left + right) / 2;
		int midVal = arr[mid];
		if(findVal > midVal){	//向右递归
			return binarySerch2(arr, mid + 1, right, findVal);
		}else if(findVal < midVal){	//向左递归
			return binarySerch2(arr, left, mid-1, findVal);
		}else{
			
			List<Integer> reget = new ArrayList<Integer>();
			//向mid索引值的左边扫描,将所有满足 1000的元素的下标，加入到集合ArrayList中
			int temp = mid - 1;
			while(true){
				if(temp < 0 || arr[temp] != findVal){	//已经将最左边都扫描完成
					break;
				}
				//否则,就将temp放入集合
				reget.add(temp);
				temp -= 1;	//向左移动temp
			}
			reget.add(mid);	//放入中间值
			
			//向mid索引值的右边扫描,将所有满足 1000的元素的下标，加入到集合ArrayList中
			temp = mid + 1;
			while(true){
				if(temp > arr.length - 1 || arr[temp] != findVal){	//已经将最右边都扫描完成
					break;
				}
				//否则,就将temp放入集合
				reget.add(temp);
				temp += 1;	//向右移动temp
			}
			return reget;
		}
	}
}

插值查找分析与实现

插值查找原理

插值查找算法类似于二分查找，不同的是插值查找每次从自适应mid处开始查找。

将折半查找中的求mid 索引的公式 , low 表示左边索引left, high表示右边索引right. key 就是前面我们讲的findVal

int mid = low + (high - low) * (key - arr[low]) / (arr[high] - arr[low]) ;/插值索引/
对应前面的代码公式：
int mid = left + (right – left) * (findVal – arr[left]) / (arr[right] – arr[left])

举例说明插值查找算法 1-100 
    
具体思路:    

数组  arr = [1, 2, 3, ......., 100]

假如我们需要查找的值  1 

使用二分查找的话，我们需要多次递归，才能找到 1

使用插值查找算法:
int mid = left + (right – left) * (findVal – arr[left]) / (arr[right] – arr[left])

int mid = 0 + (99 - 0) * (1 - 1)/ (100 - 1) = 0 + 99 * 0 / 99 = 0 

比如我们查找的值 100

int mid = 0 + (99 - 0) * (100 - 1) / (100 - 1) = 0 + 99 * 99 / 99 = 0 + 99 = 99 
    
综上,插值查找算法 ==》 套公式计算即可

应用案例

请对一个有序数组进行插值查找 {1,8, 10, 89, 1000, 1234} ，输入一个数看看该数组是否存在此数，并且求出下标，如果没有就提示"没有这个数"。

public class InsertValueSearch {

	public static void main(String[] args) {
		
		int arr[] = {1,8, 10, 89, 1000, 1234};
		
		int index = insertValue(arr, 0, arr.length - 1, 1234);
		System.out.println("index = " + index);
		
		int index2 = binarySerch(arr, 0, arr.length, 1234);
		System.out.println("index2 = " + index2);

	}
	
	public static int binarySerch(int arr[],int left,int right,int findVal){
		System.out.println("二分查找的调用:");
		//当left > right时,整个数组都没有
		if(left > right){	//没有这个判断,会造成死递归！！！！
			return -1;
		}
		int mid = (left + right) / 2;
		int midVal = arr[mid];
		if(findVal > midVal){	//向右递归
			return binarySerch(arr, mid + 1, right, findVal);
		}else if(findVal < midVal){	//向左递归
			return binarySerch(arr, left, mid-1, findVal);
		}else{
			return mid;
		}
	}
	
	/** * 插值查找算法,也要求数组是有序的!!! * @Description 插值查找算法 * @author subei * @date 2020年5月31日下午9:43:59 * @param arr 数组 * @param left 左边的索引 * @param right 右边的索引 * @param findVal 查找的值 * @return 如果找到,就返回对应的下标,如果没有找到,返回-1 */
	public static int insertValue(int arr[],int left,int right,int findVal){
		System.out.println("查找的调用:");
		
		//注意：findVal < arr[0] 和 findVal > arr[arr.length - 1] 必须需要
		//否则将会得到的 mid可能越界
		if (left > right || findVal < arr[0] || findVal > arr[arr.length - 1]) {
			return -1;
		}
		//计算mid,自适应写法
		int mid = left + (right - left) * (findVal - arr[left]) / (arr[right] - arr[left]);
		int midVal = arr[mid];
		if(findVal > midVal){	//向右查找
			return insertValue(arr, mid + 1, right, findVal);
		}else if(findVal < midVal){	//向左查找
			return insertValue(arr, left, mid - 1, findVal);
		}else{	//找到了！！！
			return mid;
		}
	}
}

插值查找注意事项：
- 对于数据量较大，关键字分布比较均匀的查找表来说，采用插值查找,速度较快.
- 关键字分布不均匀的情况下，该方法不一定比折半查找要好.

斐波那契查找分析与实现

斐波那契(黄金分割法)查找基本介绍
- 黄金分割点是指把一条线段分割为两部分，使其中一部分与全长之比等于另一部分与这部分之比。取其前三位数字的近似值是0.618。由于按此比例设计的造型十分美丽，因此称为黄金分割，也称为中外比。这是一个神奇的数字，会带来意向不大的效果。
- 斐波那契数列 {1, 1, 2, 3, 5, 8, 13, 21, 34, 55 } 发现斐波那契数列的两个相邻数的比例，无限接近黄金分割值0.618

斐波那契(黄金分割法)原理

斐波那契查找原理与前两种相似，仅仅改变了中间结点（mid）的位置，mid不再是中间或插值得到，而是位于黄金分割点附近，即mid=low+F(k-1)-1（F代表斐波那契数列），如下图所示:

对F(k-1)-1的理解：
- 由斐波那契数列 F[k]=F[k-1]+F[k-2] 的性质，可以得到（F[k]-1）=（F[k-1]-1）+（F[k-2]-1）+1 。该式说明：只要顺序表的长度为F[k]-1，则可以将该表分成长度为F[k-1]-1和F[k-2]-1的两段，即如上图所示。从而中间位置为mid=low+F(k-1)-1。
- 类似的，每一子段也可以用相同的方式分割。
- 但顺序表长度n不一定刚好等于F[k]-1，所以需要将原来的顺序表长度n增加至F[k]-1。这里的k值只要能使得F[k]-1恰好大于或等于n即可，由以下代码得到，顺序表长度增加后，新增的位置（从n+1到F[k]-1位置），都赋为n位置的值即可。

while(n > fib(k) - 1){
    k++;
}

应用案例

请对一个有序数组进行斐波那契查找 {1,8, 10, 89, 1000, 1234} ，输入一个数看看该数组是否存在此数，并且求出下标，如果没有就提示"没有这个数"。

import java.util.Arrays;

public class FibSearch {

	public static int maxSize = 20;

	public static void main(String[] args) {
		int arr[] = { 1, 8, 10, 89, 1000, 1234 };
		System.out.println("index = " + fibS(arr, 189));
	}

	// 因为后面需要使用公式 mid=low+F(k-1)-1,因此需要先获取到一个斐波那契数列
	// 用非递归方法得到一个斐波那契数列
	public static int[] fib() {
		int f[] = new int[maxSize];
		f[0] = 1;
		f[1] = 1;
		for (int i = 2; i < maxSize; i++) {
			f[i] = f[i - 1] + f[i - 2];
		}
		return f;
	}

	/** * * @Description 使用非递归的方式编写斐波那契算法 * @author subei * @date 2020年5月31日下午10:20:37 * @param a * 数组 * @param key * 需要查找的关键码(值) * @return 返回对应的下标,如果没有-1 */
	public static int fibS(int[] a, int key) {
		int low = 0;
		int hight = a.length - 1;
		int k = 0; // 斐波那契数列的下标
		int mid = 0; // 存放mid值
		int f[] = fib(); // 获取到斐波那契数列
		// 获取到斐波那契分割数值的下标
		while (hight > f[k] - 1) {
			k++;
		}
		// 因为 f[k] 值 可能大于 a 的 长度,因此我们需要使用Arrays类,构造一个新的数组,并指向temp[]
		// 不足的部分会使用0填充
		int[] temp = Arrays.copyOf(a, f[k]);
		// 实际上需求使用a数组最后的数填充 temp
		// 举例:
		// temp = {1,8, 10, 89, 1000, 1234, 0, 0} =》 {1,8, 10, 89, 1000, 1234,
		// 1234, 1234,}
		for (int i = hight + 1; i < temp.length; i++) {
			temp[i] = a[hight];
		}
		// 利用循环查找key
		while (low <= hight) { // 满足这个条件,即可以找到
			mid = low + f[k - 1] - 1;
			if (key < temp[mid]) { // 继续向左边查找
				hight = mid - 1;
				// 使用k--的原因
				// 说明:
				// 1.全部元素 = 前面的元素 + 后边元素
				// 2.f[k] = f[k-1] + f[k-2]
				// 因为 前面有 f[k-1]个元素,所以可以继续拆分 f[k-1] = f[k-2] + f[k-3]
				// 即 在 f[k-1] 的前面继续查找 k--
				// 即下次循环 mid = f[k-1-1]-1
				k--;
			} else if (key > temp[mid]) { // 继续向右边查找
				low = mid + 1;
				// 使用k -= 2 的原因
				// 说明
				// 1.全部元素 = 前面的元素 + 后边元素
				// 2.f[k] = f[k-1] + f[k-2]
				// 3.因为后面我们有f[k-2] 所以可以继续拆分 f[k-1] = f[k-3] + f[k-4]
				// 4.即在f[k-2] 的前面进行查找 k -= 2
				// 5.即下次循环 mid = f[k - 1 - 2] - 1
				k -= 2;
			} else { // 找到了！！！
				// 需要确定,返回的是哪个下标
				if (mid <= hight) {
					return mid;
				} else {
					return hight;
				}
			}
		}
		return -1;
	}
}

本章思维导图

第八章哈希表

哈希表的介绍和内存布局

先看一个实际需求，google公司的一个上机题:

有一个公司,当有新的员工来报道时,要求将该员工的信息加入(id,性别,年龄,住址…),当输入该员工的id时,要求查找到该员工的所有信息.

要求: 不使用数据库,尽量节省内存,速度越快越好=>哈希表(散列)

散列表（Hash table，也叫哈希表），是根据关键码值(Key value)而直接进行访问的数据结构。也就是说，它通过把关键码值映射到表中一个位置来访问记录，以加快查找的速度。这个映射函数叫做散列函数，存放记录的数组叫做散列表。

所以什么叫哈希表？

哈希表可以用来高效率解决元素不可重复这个问题，其本质就是：数组+链表+红黑树(后面会写)。

哈希表实现

有一个公司,当有新的员工来报道时,要求将该员工的信息加入(id,性别,年龄,名字,住址…),当输入该员工的id时,要求查找到该员工的所有信息。

要求:
1)不使用数据库,,速度越快越好 => 哈希表(散列).
2)添加时，保证按照id从低到高插入
    [课后思考：如果id不是从低到高插入，但要求各条链表仍是从低到高，怎么解决?]
3)使用链表来实现哈希表,该链表不带表头[即:链表的第一个结点就存放雇员信息]
4)思路分析并画出示意图

思路图解

使用哈希表来管理雇员信息

代码实现

import java.util.Scanner;

public class HashTable {
	public static void main(String[] args) {
		//创建哈希表
		HashTab hashTab = new HashTab(7);
		
		//写一个简单的菜单
		String key = "";
		Scanner scanner = new Scanner(System.in);
		while(true) {
			System.out.println("雇员管理系统:");
			System.out.println("add : 添加雇员");
			System.out.println("list: 显示雇员");
			System.out.println("find: 查找雇员");
			System.out.println("del : 删除雇员");
			System.out.println("exit: 退出系统");
			
			key = scanner.next();
			switch (key) {
			case "add":
				System.out.print("输入id:");
				int id = scanner.nextInt();
				System.out.print("输入名字:");
				String name = scanner.next();
				//创建雇员
				Emp emp = new Emp(id, name);
				hashTab.add(emp);
				break;
			case "list":
				hashTab.list();
				break;
			case "find":
				System.out.print("请输入需要查找的id:");
				id = scanner.nextInt();
				hashTab.findEmpId(id);
				break;
			case "del": 
                System.out.print("请输入雇员的id:");
                id = scanner.nextInt();
                hashTab.delEmpId(id);
                break;			
			case "exit":
				scanner.close();
				System.exit(0);
			default:
				break;
			}
		}
	}
}
//创建HashTab
class HashTab{
	private EmpLink[] empLinkArry;
	private int size; //表示有多少条链表
	
	//构造器
	public HashTab(int size){
		this.size = size;
		//初始化empLinkArry
		empLinkArry = new EmpLink[size];
		//分别初始化每个链表,很重要！！！！
		for(int i = 0; i < size; i++) {
			empLinkArry[i] = new EmpLink();
		}
	}
	
	//添加雇员
	public void add(Emp emp){
		//根据员工的ID,得到该员工应该到哪条链表
		int empLinkNo = hashFun(emp.id);
		//将emp添加到对应的链表中
		empLinkArry[empLinkNo].add(emp);
	}
	
	//遍历所有的链表,遍历hashTab
	public void list() {
		for(int i = 0; i < size; i++) {
			empLinkArry[i].list(i);
		}
	}
	
	//编写一个散列函数,使用一个简单的取模法
	public int hashFun(int id){
		return id % size;
	}
	
	//根据输入的id,查找雇员
	public void findEmpId(int id){
		//使用散列函数确定到哪条链表查找
		int empLinkNO = hashFun(id);
		Emp emp = empLinkArry[empLinkNO].findEmpId(id);
		if(emp != null) {//找到
			System.out.printf("在第%d条链表中找到,雇员 id = %d\n", (empLinkNO + 1), id);
		}else{
			System.out.println("在哈希表中,没有找到该雇员~");
		}
	}
	
	//根据雇员的Id从哈希表中删除雇员
	public void delEmpId(int id){
		int index = hashFun(id);
		empLinkArry[index].delEmp(id);
	}
}

//表示一个雇员
class Emp{
	public int id;
	public String name;
	public Emp next; // next默认为 null
	public Emp(int id, String name) {
		super();
		this.id = id;
		this.name = name;
	}
}

//创建一个EmpLink,表示链表
class EmpLink{
	//头指针,指向第一个Emp,因此这个链表的head是有效的,直接指向第一个Emp
	private Emp head;	//默认为null
	//添加雇员到链表
	//说明
	//1.假设,当添加雇员时,id是自增长,即id的分配总是从小到大
	// 因此可以将该雇员直接加入到本链表的最后即可
	public void add(Emp emp){
		//如果是添加第一个雇员
		if(head == null){
			head = emp;
			return;
		}
		//如果不是第一个,则使用一个辅助指针,帮助定位
		Emp curEmp = head;
		while(true){
			if(curEmp.next == null){	//到达链表的最后
				break;
			}
			curEmp = curEmp.next;	//后移
		}
		//退出时直接将emp,加入链表
		curEmp.next = emp;
	}
	//遍历链表
	public void list(int nums){
		if(head == null){	//链表为空
			System.out.println("第" + (nums+1) + "链表为空");
			return;
		}
		System.out.println("第" + (nums+1) + "链表的信息:");
		Emp curEmp = head;	//辅助指针
		while(true){
			System.out.printf("=> id = %d name = %s\t",curEmp.id,curEmp.name);
			if(curEmp.next == null){	//说明curEmp已经是最后的节点
				break;
			}
			curEmp = curEmp.next;	//后移
		}
		System.out.println();
	}
	
	//根据id查询雇员
	//如果查找到,就返回Emp,没有找到,就返回null
	public Emp findEmpId(int id){
		//判断链表是否为空
		if(head == null){
			System.out.println("链表为空.");
			return null;
		}
		//辅助指针
		Emp curEmp = head;
		while(true){
			if(curEmp.id == id){	//找到
				break;	//此时curEmp就指向要查找的雇员
			}
			//退出
			if(curEmp.next == null){	//未找到该雇员
				curEmp = null;
			}
			curEmp = curEmp.next;	//后移
		}
		return curEmp;
	}
	
	//删除雇员
	public void delEmp(int id){
		if(head == null){
			System.out.println("没有这个员工！！！");
			return;
		}
		//如果删除的是头节点
		if(head.id == id){
			head = head.next;
			return;
		}
		//如果删除的不是头节点
		Emp temp = head;
		while(temp.next != null){
			if (temp.next.id == id) {
                temp.next = temp.next.next;
                System.out.println("Id为" + id + "的员工已经被删除~~");
                return;
            }
		}
		System.out.println("没有这个员工！！！");
	}
}