前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布

散列

作者头像
Rikka
发布2022-02-07 07:58:52
1.8K0
发布2022-02-07 07:58:52
举报
文章被收录于专栏:rikkarikka

复杂度分析:

  • 顺序查找: O(n)
  • 二分查找: O(\log_2n)
  • 散列方法: O(C)

散列表与散列方法

将一个元素的关键码和存储位置之间建立对应的函数关系 Hash( ), 使得每个关键码与结构中的唯一的存储位置相对应:

Address=Hash( )

需要解决两个问题:

  • 找到一个合适的散列函数,避免或尽量减少冲突
  • 拟定解决冲突的方案

散列函数

取余法

\rm hash(key) = key\%p, p\leq m

散列表中地址数位m, p为不大于m但最接近m的质数.

取最大质数是为了减少冲突.

平方取中法

hash(key) = key^2的中间部分

长度取决于表的大小. 如表长 = 2^9 =(512)_{10} , 地址 000\sim 777,

key

平方

散列地址

(2061)_8

4310541

310

(1100)_8

1210000

210

乘法杂凑函数

\rm hash(key) = M\times((\phi \times key)\% 1)_{10}

将结果化成八进制

处理冲突的闭散列(开地址)方法

产生冲突元素的关键码互为同义词.

闭散列又叫开地址法. 所有的桶都直接放在散列表数组中,并且把该数组组织成环形结构. 每个桶只有一个元素. 当发生冲突时, 把这个元素存放进表中”下一个”空桶中.寻找空桶的方法有很多.

线性探查法

hash(key)=d并且这个桶已经被占用, 那么检查数组中连续的桶:d+1,d+2...m-1,0,...d-1.寻找下一个桶的公式:

H_{i+1} = (H_i+1)\%m, i=1,2,...,m-1

每次发生冲突就探查下一个桶, 当循环 m-1 次后就会回到开始探查时的位置,说明待查关键码不在表内且表已满,不能再插入新的关键码.

\rm ASL_{succ} : 搜索成功的平均搜索次数, 搜索成功时, 把找到的每个元素的比较次数求和比上元素个数得到\rm ASL_{succ}

\rm ASL_{unsucc}: 搜索失败时平均探查次数, 指在表中没有找到与待插入元素关键码相同的元素, 但找到空桶(即最终插入位置)时平均探查次数. 它是对于散列表中每个地址而言的, 其实就是从每个桶到下一个空桶需要探查的次数的平均值.

散列表存储的是元素集合, 不允许关键码相同的元素存在.

注意:闭散列情况下不能真正地将已有的元素删去, 因为中间的元素被删掉后会影响到之后元素的探查. 所以用一个状态数组来标识哈希表中每个元素的状态.

二次探查法

若用hash函数算得的桶 H_0 已经被占用,那么下 i 个桶号 H_{i}:

\begin{aligned} H_{i}=(H_0+i^2)\%m,i = 1,3,5...\\ H_{i}=(H_0-i^2)\%m,i = 2,4,6...\\ \end{aligned}

假设上一个桶号为 H_{i-1},用一个标识 odd 控制是加还是减, 可得 H_{i}:

\begin{aligned} H_{i} = (H_{i_1} + 2*i-1)\% m, odd=0\\ H_{i} = (H_{i_1} - 2*i+1)\% m, odd=1\\ \end{aligned}

每次查找完后, 将odd 取反.

更浅显的

代码语言:javascript
复制
bool QuadraticProbing(key)
{
  	int h0 = key%divisor;
    if(info[h0]==empty||info[h0]==deleted||table[h0]==key)
        return h0;
    int i = 0;
    int iSqure = 0;
    int odd = 1;
    while(1)
    {
        if(odd == 1) 
        {
            iSqure = iSqure+2*i+1;
        }
        h0 = (h0 + odd * iSqure)%divisor;
        if(info[h0]==empty||info[h0]==deleted||table[h0]==key)
     	   return h0;
        if(odd==1) odd=-1;
        else {i++;odd=1;}
    }
}
双散列

如果hash1(key)计算得到的桶号d已经被占用, 那么用第二个散列函数hash2(key)计算得到 c, 则依次探查 d+c,d+2c,d+3c….

再散列

当表项数>表的70%时, 可以再散列.

即, 建立一个两倍大的表, 新的散列函数取距离原规模两倍大小最近的素数.

处理冲突的开散列(链地址)方法

将同义词放入同一个桶. 各个桶中的元素分别用单链表连接起来, 各个链表的表头结点组成一个向量.

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2022-02-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 散列表与散列方法
  • 散列函数
    • 取余法
      • 平方取中法
        • 乘法杂凑函数
          • 处理冲突的闭散列(开地址)方法
            • 线性探查法
            • 二次探查法
            • 双散列
            • 再散列
          • 处理冲突的开散列(链地址)方法
          相关产品与服务
          对象存储
          对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
          领券
          问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档