看数据结构写代码（61）哈希表

时间：2015-04-30 12:42:19 阅读：151 评论：0 收藏：0 [点我收藏+]

标签：哈希表哈希表c语言描述

前面说的各种查找都是基于 “比较” 的基础来进行查找的。查找的效率要看比较的次数。那么有没有不需要比较，就可以找到想要的数据的方法呢？

哈希表就是这样的一种方法，它用数组作为保存关键字的数据原型，通过一个哈希函数f(k)，来找到关键字存储的位置，从而找到想要的信息。

例如我们想要解决这样的一个问题：

假设这有一个各种字母组成的字符串，假设这还有另外一个字符串，而且这个字符串里的字母数相对少一些。什么方法能最快的查出所有小字符串里的字母在大字符串里都有？

比如，如果是下面两个字符串：

String 1: ABCDEFGHLMNOPQRS

String 2: DCGSRQPOM

我们可以用一个分配一个 26 个 int 型的整形数组 a，将 0~25 分别代表 A~Z 是否出现，如果出现则值为 1，没有出现值为0.

则我们只需遍历 String1，然后将对应的元素设置为1，然后遍历 String2 ，如果查找过程中，遇到了 0 值，则不是。否则 String2 的字母在 String1 中都存在。

哈希表虽然快速，但是其数据原型基于数组，同样有缺陷。

当查找的元素集合太大，不同的关键字，却得到同样的地址。即 k1 != k2,， F(K1) = = F(K2)，这时叫做冲突。冲突是无法避免的。只能通过一些方法减少冲突。当我们插入元素时，寻找插入位置，造成的冲突次数太多，影响查找效率，我们只能重新建表，这是个费时的过程。

而且哈希是无法按从小到大遍历数据的。

所以我们在用哈希的时候得考虑这些：

1.哈希函数

2冲突函数

3初始表长

4冲突多少次，我们就重新建表,

5.是否需要顺序遍历。

下面代码用的是

哈希函数：除整取余法

冲突函数：开发定址法（线性）

冲突次数到达表长的一半就重新建表。

哈希表基本结构，初始化和销毁

#include "stdafx.h"
#include <cstdlib>
int hashSize[] = {11,13,17,19};//哈希表容量增加 数组.

#define NULL_KEY	0
struct HashTable{
	int * base;//数据的基址
	int count;//表的数量
	int sizeIndex;//表的容量大小的索引
};

void initHash(HashTable * t){
	t->sizeIndex =0;
	t->base = (int *)calloc(hashSize[t->sizeIndex],sizeof(int));
	t->count = 0;
}

void destoryHash(HashTable * t){
	free(t->base);
	t->base = NULL;
	t->sizeIndex = 0;
	t->count = 0;
}

哈希函数：

//除留余数法
int hash(HashTable t,int key){
	return key % hashSize[t.sizeIndex];
}

冲突函数：

//开发定址 线性探索解决冲突法
int collision(HashTable t,int key,int times){
	return (key + times) % hashSize[t.sizeIndex];
}

查找函数：

int search(HashTable t,int key,int * index,int *ctimes){
	*index = hash(t,key);
	*ctimes = 0;
	while (t.base[*index] != NULL_KEY && t.base[*index] != key){
		(*ctimes)++;
		*index = collision(t,key,*ctimes);
	}
	printf("------------查找%d, 查找了%d次--------------\n",key,*ctimes+1);
	if (t.base[*index] == key){
		return t.base[*index];
	}
	else{
		return NULL_KEY;
	}
}

插入关键字，以及重建表函数：

void reCreateHashTable(HashTable * t,int key);
void insertHash(HashTable *t,int key){
	int index;//插入位置
	int	ctimes;//冲突次数
	int result = search(*t,key,&index,&ctimes);
	if (result == NULL_KEY && ctimes < hashSize[t->sizeIndex]/2){//没找到
		t->base[index] = key;
		t->count ++;
	}
	else{//重新建表
		reCreateHashTable(t,key);
	}
}

//
void reCreateHashTable(HashTable * t,int key){
	printf("--------------重建哈希表----------------\n");
	int * oldBase = t->base;//保存老空间.
	int oldSize = hashSize[t->sizeIndex];//老空间的容量大小
	t->sizeIndex++;
	int newSize = hashSize[t->sizeIndex];//新空间大小
	t->base = (int *) calloc(newSize,sizeof(int));//新空间
	//插入之前将 表的数量置0
	t->count = 0;
	for (int i = 0; i < oldSize; i++){
		if (oldBase[i] != NULL_KEY){
			insertHash(t,oldBase[i]);
		}
	}
	free(oldBase);//释放老空间
	insertHash(t,key);//插入冲突的关键字.
}

测试函数：

static int testArray[10] = {1,18,7,55,23,45,98,76,35,29};

int _tmain(int argc, _TCHAR* argv[])
{
	HashTable table;
	initHash(&table);
	for (int i = 0; i < 10; i++){
		insertHash(&table,testArray[i]);
	}
	int index ,count;
	for (int i = 0; i < 10; i++){
		search(table,testArray[i],&index,&count);
	}
	destoryHash(&table);
	return 0;
}

代码工程文件网盘地址：http://pan.baidu.com/s/1kToXLcj

看数据结构写代码（61）哈希表

标签：哈希表哈希表c语言描述

原文地址：http://blog.csdn.net/fuming0210sc/article/details/45391349

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

看数据结构写代码（61） 哈希表

看数据结构写代码（61）哈希表