数据结构与算法~查找

博主： Xherlock
发布时间：2021 年 12 月 12 日
768 次浏览
暂无评论
9366字数
分类：数据结构与算法

查找

查找的基本概念

查找表：由同一类型的数据元素（或记录）构成的集合

关键字：数据元素（或记录）中某个数据项的值，用它可以标识一个数据元素（或记录）

主关键字：可以唯一地标识一个记录的关键字
次关键字：用以识别若干记录的关键字

查找：根据给定的值，在查找表中确定一个其关键字等于给定值的记录或数据元素

动态查找表/静态查找表：查找的同时对表进行修改操作（插入/删除），即创建表，则该表称为动态查找表，否则为静态查找表

平均查找长度：为确定记录在查找表中的位置，需和给定值进行比较的关键字个数的期望值（ASL）

n：记录的个数
p$_{i}$：查找第i个记录的概率
c$_{i}$：找到第i个记录所需的比较次数

线性表的查找

顺序查找

从表的一端开始，依次将记录的关键字和给定值进行比较，若某个记录的关键字和给定值相等，则查找成功；反之，若扫描整个表后，仍未找到关键字和给定值相等的数据，则查找失败

适用于线性表的顺序存储结构、链式存储结构

typedef struct 
{
     ElemType *R;     //表基址
     int length;    //表长
}SSTable;

普通顺序查找

int Search_Seq(SSTable ST, KeyType key)
{
    for(int i = ST.length; i>=1; --i)
        if(ST.R[i].key == key)
            return i;
    return 0;
}

改进-->设置监视哨的顺序查找

int Search_Seq(SSTable ST, KeyType key)
{
    ST.R[0].key = key;    // key值存入表头（哨兵）
    int i;
    for(i = ST.length; ST.R[i].key != key; --i);
    return i;
}

免去了查找过程中每一步都要检测整个表是否查找完毕

ASL = (n+1)/2 时间复杂度： O(n)

优点

对表结构无任何要求，适用于线性表的顺序存储结构、链式存储结构

缺点

平均查找长度较大，查找效率较低，n很大时，不宜采用顺序查找

折半查找

也称二分查找，查找效率较高，但要求线性表必须采用顺序存储结构，且表中元素按关键字有序排列

查找过程

从表的中间记录开始，若给定值和中间记录的关键字相等，则查找成功；若大于或小于中间记录的关键字，则在表中大于或小于中间记录的那一半中查找，并重复操作，直到查找成功

用low和high表示当前查找区间的下界和上界，mid为区间的中间位置

算法

int Search_Bin(SSTable ST,KeyType key)
{
    //若找到，则函数值为该元素在表中的位置，否则为0
    low=1;
    high=ST.length;                                                 while(low<=high){
        mid=(low+high)/2;
        if(key==ST.R[mid].key) 
            return mid; 
        else if(key<ST.R[mid].key) 
            high=mid-1;        //前一子表查找
        else 
            low=mid+1;        //后一子表查找
    }                                      
    return 0;        //表中不存在待查元素
}

递归

int Search_Bin (SSTable ST, keyType key, int low, int high) 
{ 
      if(low>high) 
          return 0;   //查找不到时返回0 
      mid=(low+high)/2; 
      if(key==ST.elem[mid].key)  
          return mid; 
      else if(key<ST.elem[mid].key)  
          Search_Bin(ST, key, low, mid-1)    //递归
      else
          Search_Bin(ST, key, mid+1, high)    //递归
}

ASL=每一层结点数*深度之和/总结点数

查找成功时比较次数：d = [log$_{2}$n] + 1

优点

比较次数少，查找效率高时间复杂度O(log$_{2}$n)

缺点

对表结构要求高，只能用于顺序存储的有序表，查找前需排序，费时

不适于数据元素经常变动的线性表

分块查找

索引顺序查找，性能介于顺序和折半查找之间

查找过程

分成若干子表，每个子表中的数值都比后一块中数值小（子表中未必有序），构造索引表，由各子表中的最大关键字和起始地址（头指针）构成

对索引表进行顺序或折半查找（索引表有序）
确定了待查关键字所在子表后，顺序查找（子表无序）

查找性能

ASL = L$_{b}$+L$_{w}$

L$_{b}$：索引表查找的ASL

L$_{w}$：子表查找的ASL

s为每块内部的记录个数，n/s即块的数目

优点

插入和删除比较容易，无需大量移动

缺点

要增加一个索引表的存储空间并对初始索引表进行排序运算

适用于既要快速查找又经常变动的线性表

Fibonacci查找

查找过程

根据Fibonacci数列特点对查找表分割

	顺序查找	折半查找	分块查找
ASL	最大	最小	两者之间
表结构	有序表、无序表	有序表	分块有序表
存储结构	顺序存储结构线性链表	顺序存储结构	顺序存储结构线性链表

树表的查找

二叉排序树

空树或具有下面性质的树

左子树不空，则左子树上的所有结点值小于它的根结点的值
右子树不空，则右子树上的所有结点值大于它的根结点的值
左、右子树也分别为二叉排序树

构造二叉排序树目的：提高查找和插入删除关键字的速度

中序遍历二叉排序树得到一个递增序列

查找算法

二叉排序树为空，查找失败，返回空指针
非空，给定key值与根结点的关键字值比较
- =：查找成功，返回根结点地址
- <：查其左子树
- >：查其右子树
递归实现

BSTree SearchBST(BSTree T,KeyType key) 
{
    if((!T) || key==T->data.key) 
        return T;            
    else if (key<T->data.key)  
        return SearchBST(T->lchild,key);    //在左子树中继续查找
    else 
        return SearchBST(T->rchild,key);                       //在右子树中继续查找
} // SearchBST

插入

先查找，已有不再插
没有，查找至某个叶子结点的左子树或右子树，插入成为左孩子或者右孩子（一定在叶结点上）

生成

一系列查找和插入实现

不同插入次序的序列生成不同形态的二叉排序树

删除

删除叶结点，双亲结点指向它后释放即可
被删除结点缺右子树，双亲结点指向它的左子女结点，释放它
被删除结点缺左子树，双亲结点指向它的右子女结点，释放它
被删结点左右子树均存在，此时可以用它的前驱节点或后继结点代替它，这样整体结构变化很小

查找性能

平均查找长度和二叉树的形态有关

最好：log$_{2}$n（形态匀称，与二分查找的判定树相似）

最坏: （n+1)/2（单支树）

因此提出平衡二叉树（AVL树）

平衡二叉树

每一个结点的左子树和右子树的高度之多差绝对值小于等于1

平衡因子BF

该结点左子树和右子树的高度差 ==》-1、0、1

最小不平衡二叉树

距离插入结点最近的，且平衡因子的绝对值大于1的结点为根的子树，称其为最小不平衡二叉树

平衡二叉树实现即调整最小不平衡二叉树中各结点的链接关系，使之成为新的平衡子树

LL平衡旋转

顺时针旋转

void  LL_rotate(BBSTNode *a)
{ 
    BBSTNode *b;
    b=a->Lchild; 
    a->Lchild=b->Rchild;
    b->Rchild=a;
    a->Bfactor=b->Bfactor=0; 
    a=b;
}

RR平衡旋转

逆时针旋转

结点3本来是4的左孩子，由于旋转后需满足二叉排序树的特性，因此成了结点2的右孩子

Void *RR_rotate(BBSTNode *a)
{  
    BBSTNode *b;
    b=a->Rchild; 
    a->Rchild=b->Lchild; 
    b->Lchild=a;
    a->Bfactor=b->Bfactor=0; 
    a=b;
}

RL平衡旋转

如下不能直接进行顺时针旋转

结点7的BF为-2，结点10的为1，一正一副，故不能直接旋转

应先将结点9和10顺时针旋转后再整体逆时针旋转

Void  RL_rotate(BBSTNode *a)
{  
    BBSTNode *b,*c ;
    b=a->Rchild; 
    c=b->Lchild;      /*  初始化  */
    a->Rchild=c->Lchild;  
    b->Lchild=c->Rchild;
    c->Lchild=a;  
    c->Rchild=b;
    if (c->Bfactor==1)
    {   
        a->Bfactor=0; 
        b->Bfactor=-1;   
    }
    else if (c->Bfactor==0)  
        a->Bfactor=b->Bfactor=0;
    else {   
        a->Bfactor=1;
        b->Bfactor=0;   
    }
}

LR平衡旋转

道理同RL一样

先逆时针旋转两个，再整体顺时针旋转

void  LR_rotate(BBSTNode *a)
{  
    BBSTNode *b,*c;
    b=a->Lchild; 
    c=b->Rchild;      /*  初始化  */
    a->Lchild=c->Rchild;  
    b->Rchild=c->Lchild;
    c->Lchild=b;  
    c->Rchild=a;
    if (c->Bfactor==1) 
    {   
        a->Bfactor=-1;
        b->Bfactor=0;   
    }
    else if (c->Bfactor==0)  
        a->Bfactor=b->Bfactor=0;
    else {   
        a->Bfactor=0;
        b->Bfactor=1;   
    }
}

平衡二叉排序树的插入

判断插入结点后二叉排序树是否产生不平衡
找出失衡的最小子树
判断旋转类型，做出调整

bool InsertAVL(BSTree &T, int e, bool &taller)    {//插入结点 e 
    if(!T){  //插入，树长高 
        T=(BSTree)malloc(sizeof(BSTNode));
        T->data=e;
        T->lchild=NULL;
        T->rchild=NULL;
        T->bf=0;
        taller=TRUE;
    }else{  
        if(e == T->data){   //已存在 
            taller=FALSE;
            printf("已存在相同结点\n"); 
            return 0;
        }
        if(T->data > e){ //左树中搜索 
            if(!InsertAVL(T->lchild,e,taller)){
                return 0; //未插入 
            }
            if(taller){
                switch(T->bf){
                    case 0:    //等高
                        T->bf=1; taller=TRUE;break;
                    case 1:    //左高，左平衡
                        LeftBalance(T);taller=FALSE;break; 
                    case -1:  //右高，现等高
                        T->bf=0;taller=FALSE;break; 
                }
            }
        }
        else{
            if(!InsertAVL(T->rchild,e,taller)){
                return 0;
            }
            if(taller){
                switch(T->bf){
                    case 0:   
                        T->bf=-1; taller=TRUE;break;
                    case 1:   
                        T->bf=0;taller=FALSE;break; 
                    case -1:  
                        RightBalance(T);taller=FALSE;break; 
                }
            }
        }
    }
    return 1; 
}
void LeftBalance(BSTree &T){   //对以指针Ｔ所指结点为根的二叉树作左平衡旋转处理
    lc=T->lchild;
    switch(lc->bf){
        case 1:   //插在T左孩的左树，右旋 
            T->bf=lc->bf=0;
            R_Rotate(T);
            break;
        case -1: //插在T左孩的右树，双旋 
            rd=lc->rchild;
            switch(rd->bf){ //修改T及左孩平衡因子 
                case 1:
                    T->bf=-1;lc->bf=0;break;
                case 0:
                    T->bf=lc->bf=0;break;
                case -1:
                    T->bf=0;lc->bf=1;break; 
            }
            rd->bf=0;
            L_Rotate(T->lchild);
            R_Rotate(T);
    }
}

多路查找树

每个结点的孩子数可以多于两个，且每一个结点可以存储多个元素

B-树

m阶B-树（m≥3）

每个结点分指数≤m
根结点分支数≥2
其余分支结点的分支数≥[m/2]
所有叶子结点在同一层，不带信息，成为失败结点

具体内容看课本

哈希表的查找

【数据结构与算法】详解什么是哈希表，并用代码手动实现一个哈希表_零一的博客-CSDN博客

定义

记录的存储位置与关键字之间存在对应关系-->哈希函数实现

优点：查找速度极快，查找效率和元素个数n无关

哈希方法：选取某个函数，依该函数按关键字计算元素的存储位置，并按此存放；查找时，由同一个函数对给定值k计算地址，将k与地址单元中元素关键码进行比，确定查找是否成功。

冲突：不同的关键码映射到同一个哈希地址

eg：

key1 ≠ key2 但H(key1)=H(key2)

同义词：具有相同函数值的两个关键字

减少冲突

构造好的哈希函数
制定一个好的解决冲突方案

直接定址法

Hash(key) = a×key + b (a、b为常数)

优点

以关键码key的某个线性函数值为哈希地址，不会产生冲突

缺点

要占用连续的地址空间，空间效率低

数字分析法

对关键字进行分析，取关键字的若干位或组合作为哈希地址（如学号、编码之类的）

平方取中法

将关键字平方后去中间几位作为哈希地址

折叠法

将关键字分割成位数相同的几部分（最后一部分可以不同），然后取这几部分的叠加和作为哈希地址

数位叠加：

移位叠加：将分割后的几部分低位对齐相加
间界叠加：从一段到另一端沿分割界来回折叠，然后对齐相加

适用于关键字位数很多，且每一位上数字分布大致均匀的情况

除留余数法（更优）

Hash(key)=key mod p (p是一个整数)

设表长m

选取p≤m且为质数
选取p=2$^{i}$(p≤m)：运算便于用移位来实现，但等于将关键字的高位忽略而仅留下低位二进制数，高位不同而低位相同的关键字是同义词
选取p=q×f(q、f都是质因数，p≤m)：则所有含有q或f因子的关键字的散列地址均是q或f的倍数

随机数法

构造哈希函数考虑因素

执行速度
关键字的长度
哈希表的大小
关键字的分布情况
查找效率

处理冲突

开放定址法

有冲突时就去寻找下一个空的哈希地址，只要哈希表足够大，总能存下

线性探测法

H~i~ = (Hash(key) + d$_{i}$ ) mod m ( 1≤i < m )

其中：m为哈希表长度

d$_{i}$为增量序列 1，2，…m-1，且d$_{i}$ = i

eg：

优点：总能放下

缺点：产生聚集现象，降低查找效率

二次探测法

解决线性探测法聚集缺点

H~i~ = (Hash(key) ± d~i~ ) mod m ( 1≤i < m )

其中：m为哈希表长度，m要求是某个4k+3的质数；

d~i~为增量序列 1$^{2}$，-1$^{2}$，2$^{2}$，-2$^{2}$，…，q$^{2}$

仍是上面的例子

伪随机数探测法

H$_{i}$ = (Hash(key) + d$_{i}$ ) mod m ( 1≤i < m )

其中：m为哈希表长度

d$_{i}$为随机数

step1 取数据元素的关键字key，计算其哈希函数值（地址）。若该地址对应的存储空间还没有被占用，则将该元素存入；否则执行step2解决冲突

step2 根据选择的冲突处理方法，计算关键字key的下一个存储地址。若下一个存储地址仍被占用，则继续执行step2，直到找到能用的存储地址为止

链地址法（更优）

相同哈希地址的记录链成一单链表，m个哈希地址就设m个单链表，然后用用一个数组将m个单链表的表头指针存储起来，形成一个动态的结构

step1 取数据元素的关键字key，计算其哈希函数值（地址）。若该地址对应的链表为空，则将该元素插入此链表；否则执行step2解决冲突

step2 根据选择的冲突处理方法，计算关键字key的下一个存储地址。若该地址对应的链表为不为空，则利用链表的前插法或后插法将该元素插入此链表

优点

非同义词不会冲突，无聚集现象
链表上结点空间动态申请，更适合于表长不确定的情况

eg：关键字(19,14,23,1,68,20,84,27,55,11,10,79)

ASL衡量查找算法

取决因素

哈希函数
处理冲突的方法
哈希表的装填因子α

α=表中填入的记录数/哈希表长度，越大，表中记录数越多，发生冲突可能性越大，查找时对比的次数就越多

最后修改：2021 年 12 月 12 日

如果觉得我的文章对你有用，请随意赞赏

发表评论取消回复
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

评论 *

私密评论

名称 *

🎲

邮箱 *

地址

Reverse（十一）
浏览次数: 8592
Win11新机鼓捣记录
浏览次数: 2731
Reverse（十三）
浏览次数: 2040
js逆向爬虫1
浏览次数: 1952
栈~数制转换
浏览次数: 1922

mars
博主你好，请问怎么知道的alloc函数属于Buffer下的方法...
lj
该评论仅登录用户及评论双方可见
Mr.Guan
:@(赞一个)
Typecho
欢迎加入 Typecho 大家族

数据结构与算法~查找

Xherlock • 2021 年 12 月 12 日

<h1>查找</h1><h2>查找的基本概念</h2><p>查找表：由同一类型的数据元素（或记录）构成的集合</p><p>关键字：数据元素（或记录）中某个数据项的值，用它可以标识一个数据元素（或记录）</p><ul><li>主关键字：可以唯一地标识一个记录的关键字</li><li>次关键字：用以识别若干记录的关键字</li></ul><p>查找：根据给定的值，在查找表中确定一个其关键字等于给定值的记录或数据元素</p><p>动态查找表/静态查找表：查找的同时对表进行修改操作（插入/删除），即创建表，则该表称为动态查找表，否则为静态查找表</p><p>平均查找长度：为确定记录在查找表中的位置，需和给定值进行比较的关键字个数的期望值（ASL）</p><p><img src="http://xherlock.top/usr/uploads/2021/12/1050584950.png" alt="image-20211125153518401.png" title="image-20211125153518401.png" style=""></p><ul><li>n：记录的个数</li><li>p$_{i}$：查找第i个记录的概率</li><li>c$_{i}$：找到第i个记录所需的比较次数</li></ul><h2>线性表的查找</h2><h3>顺序查找</h3><p>从表的一端开始，依次将记录的关键字和给定值进行比较，若某个记录的关键字和给定值相等，则查找成功；反之，若扫描整个表后，仍未找到关键字和给定值相等的数据，则查找失败</p><p>适用于线性表的顺序存储结构、链式存储结构</p><pre><code class="lang-C">typedef struct 
{
     ElemType *R;     //表基址
     int length;    //表长
}SSTable;</code></pre><h4>普通顺序查找</h4><pre><code class="lang-C">int Search_Seq(SSTable ST, KeyType key)
{
    for(int i = ST.length; i&gt;=1; --i)
        if(ST.R[i].key == key)
            return i;
    return 0;
}</code></pre><h4>改进--&gt;设置监视哨的顺序查找</h4><pre><code class="lang-C">int Search_Seq(SSTable ST, KeyType key)
{
    ST.R[0].key = key;    // key值存入表头（哨兵）
    int i;
    for(i = ST.length; ST.R[i].key != key; --i);
    return i;
}</code></pre><p>免去了查找过程中每一步都要检测整个表是否查找完毕</p><p>ASL = (n+1)/2        时间复杂度：    O(n)</p><h4>优点</h4><p>对表结构无任何要求，适用于线性表的顺序存储结构、链式存储结构</p><h4>缺点</h4><p>平均查找长度较大，查找效率较低，n很大时，不宜采用顺序查找</p><h3>折半查找</h3><p>也称二分查找，查找效率较高，但要求线性表必须采用顺序存储结构，且表中元素按关键字有序排列</p><h4>查找过程</h4><p>从表的中间记录开始，若给定值和中间记录的关键字相等，则查找成功；若大于或小于中间记录的关键字，则在表中大于或小于中间记录的那一半中查找，并重复操作，直到查找成功</p><p>用low和high表示当前查找区间的下界和上界，mid为区间的中间位置</p><h4>算法</h4><pre><code class="lang-C">int Search_Bin(SSTable ST,KeyType key)
{
    //若找到，则函数值为该元素在表中的位置，否则为0
    low=1;
    high=ST.length;                                                 while(low&lt;=high){
        mid=(low+high)/2;
        if(key==ST.R[mid].key) 
            return mid; 
        else if(key&lt;ST.R[mid].key) 
            high=mid-1;        //前一子表查找
        else 
            low=mid+1;        //后一子表查找
    }                                      
    return 0;        //表中不存在待查元素
}                                         </code></pre><p>递归</p><pre><code class="lang-C">int Search_Bin (SSTable ST, keyType key, int low, int high) 
{ 
      if(low&gt;high) 
          return 0;   //查找不到时返回0 
      mid=(low+high)/2; 
      if(key==ST.elem[mid].key)  
          return mid; 
      else if(key&lt;ST.elem[mid].key)  
          Search_Bin(ST, key, low, mid-1)    //递归
      else
          Search_Bin(ST, key, mid+1, high)    //递归
} </code></pre><p>ASL=每一层结点数*深度之和/总结点数</p><p>查找成功时比较次数：d =  [log$_{2}$n] + 1</p><h4>优点</h4><p>比较次数少，查找效率高    时间复杂度O(log$_{2}$n)</p><h4>缺点</h4><p>对表结构要求高，只能用于顺序存储的有序表，查找前需排序，费时</p><p>不适于数据元素经常变动的线性表</p><h3>分块查找</h3><p>索引顺序查找，性能介于顺序和折半查找之间</p><h4>查找过程</h4><p>分成若干子表，每个子表中的数值都比后一块中数值小（子表中未必有序），构造索引表，由各子表中的最大关键字和起始地址（头指针）构成</p><p><img src="http://xherlock.top/usr/uploads/2021/12/584252606.png" alt="image-20211202165655750.png" title="image-20211202165655750.png" style=""></p><ul><li>对索引表进行顺序或折半查找（索引表有序）</li><li>确定了待查关键字所在子表后，顺序查找（子表无序）</li></ul><h4>查找性能</h4><p>ASL = L$_{b}$+L$_{w}$</p><p>L$_{b}$：索引表查找的ASL</p><p>L$_{w}$：子表查找的ASL</p><p><img src="http://xherlock.top/usr/uploads/2021/12/1951272005.png" alt="image-20211202170016231.png" title="image-20211202170016231.png" style=""></p><p>s为每块内部的记录个数，n/s即块的数目</p><h4>优点</h4><p>插入和删除比较容易，无需大量移动</p><h4>缺点</h4><p>要增加一个索引表的存储空间并对初始索引表进行排序运算</p><p>适用于既要快速查找又经常变动的线性表</p><h3>Fibonacci查找</h3><h4>查找过程</h4><p>根据Fibonacci数列特点对查找表分割</p><table><thead><tr><th> </th><th><strong>顺序查找</strong></th><th><strong>折半查找</strong></th><th><strong>分块查找</strong></th></tr></thead><tbody><tr><td><strong>ASL</strong></td><td><strong>最大</strong></td><td><strong>最小</strong></td><td><strong>两者之间</strong></td></tr><tr><td><strong>表结构</strong></td><td><strong>有序表、无序表</strong></td><td><strong>有序表</strong></td><td><strong>分块有序表</strong></td></tr><tr><td><strong>存储结构</strong></td><td><strong>顺序存储结构</strong>  <strong>线性链表</strong></td><td><strong>顺序存储结构</strong></td><td><strong>顺序存储结构</strong>  <strong>线性链表</strong></td></tr></tbody></table><h2>树表的查找</h2><h3>二叉排序树</h3><p>空树或具有下面性质的树</p><ul><li>左子树不空，则左子树上的所有结点值小于它的根结点的值</li><li>右子树不空，则右子树上的所有结点值大于它的根结点的值</li><li>左、右子树也分别为二叉排序树</li></ul><p>构造二叉排序树目的：提高查找和插入删除关键字的速度</p><p>中序遍历二叉排序树得到一个递增序列</p><h4>查找算法</h4><ul><li>二叉排序树为空，查找失败，返回空指针</li><li><p>非空，给定key值与根结点的关键字值比较</p><ul><li>=：查找成功，返回根结点地址</li><li>&lt;：查其左子树</li><li>&gt;：查其右子树</li></ul></li><li>递归实现</li></ul><pre><code class="lang-C">BSTree SearchBST(BSTree T,KeyType key) 
{
    if((!T) || key==T-&gt;data.key) 
        return T;            
    else if (key&lt;T-&gt;data.key)  
        return SearchBST(T-&gt;lchild,key);    //在左子树中继续查找
    else 
        return SearchBST(T-&gt;rchild,key);                       //在右子树中继续查找
} // SearchBST</code></pre><h4>插入</h4><ul><li>先查找，已有不再插</li><li>没有，查找至某个叶子结点的左子树或右子树，插入成为左孩子或者右孩子（一定在叶结点上）</li></ul><h4>生成</h4><p>一系列查找和插入实现</p><p><strong>不同插入次序的序列生成不同形态的二叉排序树</strong></p><h4>删除</h4><ul><li>删除叶结点，双亲结点指向它后释放即可</li><li>被删除结点缺右子树，双亲结点指向它的左子女结点，释放它</li><li>被删除结点缺左子树，双亲结点指向它的右子女结点，释放它</li><li>被删结点左右子树均存在，此时可以用它的前驱节点或后继结点代替它，这样整体结构变化很小</li></ul><h4>查找性能</h4><p>平均查找长度和二叉树的形态有关</p><p>最好：log$_{2}$n（形态匀称，与二分查找的判定树相似）</p><p>最坏: （n+1)/2（单支树）</p><p>因此提出<strong>平衡二叉树</strong>（AVL树）</p><h3>平衡二叉树</h3><p>每一个结点的左子树和右子树的高度之多差绝对值小于等于1</p><h4>平衡因子BF</h4><p>该结点左子树和右子树的高度差 ==》-1、0、1</p><h4>最小不平衡二叉树</h4><p>距离插入结点最近的，且平衡因子的绝对值大于1的结点为根的子树，称其为最小不平衡二叉树</p><p>平衡二叉树实现即调整最小不平衡二叉树中各结点的链接关系，使之成为新的平衡子树</p><h4>LL平衡旋转</h4><p>顺时针旋转</p><p><img src="http://xherlock.top/usr/uploads/2021/12/2543760944.png" alt="AB1612D205126460D92D0ED37846CAD6.png" title="AB1612D205126460D92D0ED37846CAD6.png" style=""></p><pre><code class="lang-c">void  LL_rotate(BBSTNode *a)
{ 
    BBSTNode *b;
    b=a-&gt;Lchild; 
    a-&gt;Lchild=b-&gt;Rchild;
    b-&gt;Rchild=a;
    a-&gt;Bfactor=b-&gt;Bfactor=0; 
    a=b;
}</code></pre><h4>RR平衡旋转</h4><p>逆时针旋转</p><p><img src="http://xherlock.top/usr/uploads/2021/12/145568417.png" alt="810950A0D257F5E46C2FBC98107316F4.png" title="810950A0D257F5E46C2FBC98107316F4.png" style=""></p><p><img src="http://xherlock.top/usr/uploads/2021/12/3149343988.png" alt="F43886D7E075F8A5A73FBB87521ED35B.png" title="F43886D7E075F8A5A73FBB87521ED35B.png" style=""></p><p>结点3本来是4的左孩子，由于旋转后需满足二叉排序树的特性，因此成了结点2的右孩子</p><pre><code class="lang-C">Void *RR_rotate(BBSTNode *a)
{  
    BBSTNode *b;
    b=a-&gt;Rchild; 
    a-&gt;Rchild=b-&gt;Lchild; 
    b-&gt;Lchild=a;
    a-&gt;Bfactor=b-&gt;Bfactor=0; 
    a=b;
}</code></pre><h4>RL平衡旋转</h4><p>如下不能直接进行顺时针旋转</p><p><img src="http://xherlock.top/usr/uploads/2021/12/545566959.png" alt="A658D46929CAAB40AD5AAE1F8FA01469.png" title="A658D46929CAAB40AD5AAE1F8FA01469.png" style=""></p><p>结点7的BF为-2，结点10的为1，一正一副，故不能直接旋转</p><p>应先将结点9和10顺时针旋转后再整体逆时针旋转</p><p><img src="http://xherlock.top/usr/uploads/2021/12/3631650684.png" alt="DD70FA7A819D190A3E422CFE30B66819.png" title="DD70FA7A819D190A3E422CFE30B66819.png" style=""></p><pre><code class="lang-C">Void  RL_rotate(BBSTNode *a)
{  
    BBSTNode *b,*c ;
    b=a-&gt;Rchild; 
    c=b-&gt;Lchild;      /*  初始化  */
    a-&gt;Rchild=c-&gt;Lchild;  
    b-&gt;Lchild=c-&gt;Rchild;
    c-&gt;Lchild=a;  
    c-&gt;Rchild=b;
    if (c-&gt;Bfactor==1)
    {   
        a-&gt;Bfactor=0; 
        b-&gt;Bfactor=-1;   
    }
    else if (c-&gt;Bfactor==0)  
        a-&gt;Bfactor=b-&gt;Bfactor=0;
    else {   
        a-&gt;Bfactor=1;
        b-&gt;Bfactor=0;   
    }
}</code></pre><h4>LR平衡旋转</h4><p>道理同RL一样</p><p>先逆时针旋转两个，再整体顺时针旋转</p><pre><code class="lang-C">void  LR_rotate(BBSTNode *a)
{  
    BBSTNode *b,*c;
    b=a-&gt;Lchild; 
    c=b-&gt;Rchild;      /*  初始化  */
    a-&gt;Lchild=c-&gt;Rchild;  
    b-&gt;Rchild=c-&gt;Lchild;
    c-&gt;Lchild=b;  
    c-&gt;Rchild=a;
    if (c-&gt;Bfactor==1) 
    {   
        a-&gt;Bfactor=-1;
        b-&gt;Bfactor=0;   
    }
    else if (c-&gt;Bfactor==0)  
        a-&gt;Bfactor=b-&gt;Bfactor=0;
    else {   
        a-&gt;Bfactor=0;
        b-&gt;Bfactor=1;   
    }
}</code></pre><h4>平衡二叉排序树的插入</h4><ul><li>判断插入结点后二叉排序树是否产生不平衡</li><li>找出失衡的最小子树</li><li>判断旋转类型，做出调整</li></ul><pre><code class="lang-C">bool InsertAVL(BSTree &amp;T, int e, bool &amp;taller)    {//插入结点 e 
    if(!T){  //插入，树长高 
        T=(BSTree)malloc(sizeof(BSTNode));
        T-&gt;data=e;
        T-&gt;lchild=NULL;
        T-&gt;rchild=NULL;
        T-&gt;bf=0;
        taller=TRUE;
    }else{  
        if(e == T-&gt;data){   //已存在 
            taller=FALSE;
            printf(&quot;已存在相同结点\n&quot;); 
            return 0;
        }
        if(T-&gt;data &gt; e){ //左树中搜索 
            if(!InsertAVL(T-&gt;lchild,e,taller)){
                return 0; //未插入 
            }
            if(taller){
                switch(T-&gt;bf){
                    case 0:    //等高
                        T-&gt;bf=1; taller=TRUE;break;
                    case 1:    //左高，左平衡
                        LeftBalance(T);taller=FALSE;break; 
                    case -1:  //右高，现等高
                        T-&gt;bf=0;taller=FALSE;break; 
                }
            }
        }
        else{
            if(!InsertAVL(T-&gt;rchild,e,taller)){
                return 0;
            }
            if(taller){
                switch(T-&gt;bf){
                    case 0:   
                        T-&gt;bf=-1; taller=TRUE;break;
                    case 1:   
                        T-&gt;bf=0;taller=FALSE;break; 
                    case -1:  
                        RightBalance(T);taller=FALSE;break; 
                }
            }
        }
    }
    return 1; 
}
void LeftBalance(BSTree &amp;T){   //对以指针Ｔ所指结点为根的二叉树作左平衡旋转处理
    lc=T-&gt;lchild;
    switch(lc-&gt;bf){
        case 1:   //插在T左孩的左树，右旋 
            T-&gt;bf=lc-&gt;bf=0;
            R_Rotate(T);
            break;
        case -1: //插在T左孩的右树，双旋 
            rd=lc-&gt;rchild;
            switch(rd-&gt;bf){ //修改T及左孩平衡因子 
                case 1:
                    T-&gt;bf=-1;lc-&gt;bf=0;break;
                case 0:
                    T-&gt;bf=lc-&gt;bf=0;break;
                case -1:
                    T-&gt;bf=0;lc-&gt;bf=1;break; 
            }
            rd-&gt;bf=0;
            L_Rotate(T-&gt;lchild);
            R_Rotate(T);
    }
}</code></pre><h3>多路查找树</h3><p>每个结点的孩子数可以多于两个，且每一个结点可以存储多个元素</p><h4>B-树</h4><p>m阶B-树（m≥3）</p><ul><li>每个结点分指数&le;m</li><li>根结点分支数&ge;2</li><li>其余分支结点的分支数&ge;[m/2]</li><li>所有叶子结点在同一层，不带信息，成为失败结点</li></ul><p>具体内容看课本</p><h2>哈希表的查找</h2><p><span class="external-link"><a class="no-external-link" href="https://blog.csdn.net/l_ppp/article/details/107536781?ops_request_misc=%7B%22request%5Fid%22%3A%22163853456416780264061513%22%2C%22scm%22%3A%2220140713.130102334..%22%7D&request_id=163853456416780264061513&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~all~top_positive~default-1-107536781.pc_search_mgc_flag&utm_term=" target="_blank"><i data-feather="external-link"></i>【数据结构与算法】详解什么是哈希表，并用代码手动实现一个哈希表_零一的博客-CSDN博客</a></span></p><h3>定义</h3><p>记录的存储位置与关键字之间存在对应关系--&gt;哈希函数实现</p><p>优点：查找速度极快，查找效率和元素个数n无关</p><p>哈希方法：选取某个函数，依该函数按关键字计算元素的存储位置，并按此存放；查找时，由同一个函数对给定值k计算地址，将k与地址单元中元素关键码进行比，确定查找是否成功。</p><p>冲突：不同的关键码映射到同一个哈希地址</p><p>eg：</p><p><img src="http://xherlock.top/usr/uploads/2021/12/1112646765.png" alt="冲突" title="冲突" style=""></p><p>key1 &ne; key2    但H(key1)=H(key2)</p><p>同义词：具有相同函数值的两个关键字</p><h3>减少冲突</h3><ul><li>构造好的哈希函数</li><li>制定一个好的解决冲突方案</li></ul><h4>直接定址法</h4><p>Hash(key) = a&times;key + b  (a、b为常数)</p><h5>优点</h5><p>以关键码key的某个线性函数值为哈希地址，不会产生冲突</p><h5>缺点</h5><p>要占用连续的地址空间，空间效率低</p><h4>数字分析法</h4><p>对关键字进行分析，取关键字的若干位或组合作为哈希地址（如学号、编码之类的）</p><h4>平方取中法</h4><p>将关键字平方后去中间几位作为哈希地址</p><h4>折叠法</h4><p>将关键字分割成位数相同的几部分（最后一部分可以不同），然后取这几部分的叠加和作为哈希地址</p><p>数位叠加：</p><ul><li>移位叠加：将分割后的几部分低位对齐相加</li><li>间界叠加：从一段到另一端沿分割界来回折叠，然后对齐相加</li></ul><p>适用于关键字位数很多，且每一位上数字分布大致均匀的情况</p><h4><em>除留余数法</em>（更优）</h4><p>Hash(key)=key mod p  (p是一个整数)</p><p>设表长m</p><ul><li>选取p&le;m且为质数</li><li>选取p=2$^{i}$(p&le;m)：运算便于用移位来实现，但等于将关键字的高位忽略而仅留下低位二进制数，高位不同而低位相同的关键字是同义词</li><li>选取p=q&times;f(q、f都是质因数，p&le;m)：则所有含有q或f因子的关键字的散列地址均是q或f的倍数</li></ul><h4>随机数法</h4><h3>构造哈希函数考虑因素</h3><ul><li>执行速度</li><li>关键字的长度</li><li>哈希表的大小</li><li>关键字的分布情况</li><li>查找效率</li></ul><h3>处理冲突</h3><h4>开放定址法</h4><p>有冲突时就去寻找下一个空的哈希地址，只要哈希表足够大，总能存下</p><h5>线性探测法</h5><p>H~i~ = (Hash(key) + d$_{i}$ ) mod m    ( 1≤i &lt; m )</p><p>其中：m为哈希表长度</p><p>d$_{i}$为增量序列 1，2，…m-1，且d$_{i}$ = i</p><p>eg：</p><p><img src="http://xherlock.top/usr/uploads/2021/12/595199673.png" alt="image-20211203210447632.png" title="image-20211203210447632.png" style=""></p><p>优点：总能放下</p><p>缺点：产生聚集现象，降低查找效率</p><h5>二次探测法</h5><p>解决线性探测法聚集缺点</p><p>H~i~ = (Hash(key) &plusmn; d~i~ ) mod m    ( 1≤i &lt; m )</p><p>其中：m为哈希表长度，m要求是某个4k+3的质数；</p><p>d~i~为增量序列 1$^{2}$，-1$^{2}$，2$^{2}$，-2$^{2}$，…，q$^{2}$</p><p>仍是上面的例子</p><p><img src="http://xherlock.top/usr/uploads/2021/12/1622380783.png" alt="image-20211203210802467.png" title="image-20211203210802467.png" style=""></p><h5>伪随机数探测法</h5><p>H$_{i}$ = (Hash(key) + d$_{i}$ ) mod m    ( 1≤i &lt; m )</p><p>其中：m为哈希表长度</p><p>d$_{i}$为随机数</p><p>step1 取数据元素的关键字key，计算其哈希函数值（地址）。若该地址对应的存储 空间还没有被占用，则将该元素存入；否则执行step2解决冲突</p><p>step2 根据选择的冲突处理方法，计算关键字key的下一个存储地址。若下一个存储地址仍被占用，则继续执行step2，直到找到能用的存储地址为止</p><h4>链地址法（更优）</h4><p>相同哈希地址的记录链成一单链表，m个哈希地址就设m个单链表，然后用用一个数组将m个单链表的表头指针存储起来，形成一个动态的结构</p><p>step1 取数据元素的关键字key，计算其哈希函数值（地址）。若该地址对应的链表为空，则将该元素插入此链表；否则执行step2解决冲突</p><p>step2 根据选择的冲突处理方法，计算关键字key的下一个存储地址。若该地址对应的链表为不为空，则利用链表的前插法或后插法将该元素插入此链表</p><p>优点</p><ul><li>非同义词不会冲突，无聚集现象</li><li>链表上结点空间动态申请，更适合于表长不确定的情况</li></ul><p>eg：关键字(19,14,23,1,68,20,84,27,55,11,10,79)</p><p><img src="http://xherlock.top/usr/uploads/2021/12/2214180163.png" alt="image-20211203212436585.png" title="image-20211203212436585.png" style=""></p><h3>ASL衡量查找算法</h3><p>取决因素</p><ul><li>哈希函数</li><li>处理冲突的方法</li><li>哈希表的装填因子&alpha;</li></ul><p>&alpha;=表中填入的记录数/哈希表长度，越大，表中记录数越多，发生冲突可能性越大，查找时对比的次数就越多</p><p><img src="http://xherlock.top/usr/uploads/2021/12/979278180.png" alt="image-20211203213214612.png" title="image-20211203213214612.png" style=""></p>

查找

查找的基本概念

线性表的查找

顺序查找

普通顺序查找

改进-->设置监视哨的顺序查找

优点

缺点

折半查找

查找过程

算法

优点

缺点

分块查找

查找过程

查找性能

优点

缺点

Fibonacci查找

查找过程

树表的查找

二叉排序树

查找算法

插入

生成

删除

查找性能

平衡二叉树

平衡因子BF

最小不平衡二叉树

LL平衡旋转

RR平衡旋转

RL平衡旋转

LR平衡旋转

平衡二叉排序树的插入

多路查找树

B-树

哈希表的查找

定义

减少冲突

直接定址法

优点

缺点

数字分析法

平方取中法

折叠法

除留余数法（更优）

随机数法

构造哈希函数考虑因素

处理冲突

开放定址法

线性探测法

二次探测法

伪随机数探测法

链地址法（更优）

ASL衡量查找算法

发表评论 取消回复 使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

数据结构与算法~查找

发表评论取消回复
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款