后缀数组学习笔记

前置
重点及其目标
分析目标&&正题
代码

前置

纯属博主虎的的
罗穗骞2009NOI集训队论文
还是原版的最明白啊
先了解基数排序和倍增求sa思想
并且有一定的看别人博客的基础(对，没错，就是这么不要脸)
基数排序=>博客
这里主要说一下代码的理解及重要点

重点及其目标

根据后缀子串，他们一定是两两不同的
rk和sa也是差不多反函数关系，那rk也是不重复的
所以我们最终的目标是求出rk中无重复时的sa数组，根据定义-最差倍增到n
总的来说，求sa的过程就是不断地用基数排序倍增直到rk无重复
而基数排序从代码中很容易看出
就是是用rk[]和x[]求出sa[]的过程(封装)
那如何用rk[]和x[]求出sa[]就成了重中之重
如果明白了这个就基本理解倍增求sa的过程了

分析目标&&正题

ps:这里基数排序按照从低到高排序
我们一共有俩关键字

FOR(i,n-k+1,n) x[++num]=i;
FOR(i,1,n) if (sa[i]>k) x[++num]=sa[i]-k;

这是弄出第二关键字排序的x[]的过程
利用了上次和这次之间的交错关系
然后有的地方第二关键字没有，也就是-INF，要放在前面，还是老话，画图去
求出第二关键字排完序的x[]
这就说明我们已经完成了基数排序的一半任务了
剩下的就是利用第一关键字来排序了

FOR(i,1,n) ++c[rk[i]];
FOR(i,2,m) c[i]+=c[i-1]; 
ROF(i,n,1) sa[c[rk[i]]--]=i;

c[rk[x[i]]]-- 下标
x[i] 权值
这是根据for循环来臆测的
x[i]这是按照第二关键字排序的顺序来进行的，我们可以把x[i]看做j
也就是
c[rk[j]]-- 下标
j 权值
注意到，上下两层的第一关键字是不变的,那第一关键字就好弄了
我们用上一次的sa捣鼓出来，存在rank里面
所以就是sa[rk[j]]=j喽，但是,rk是会有重复的呀
而且我们还不知道c[]的作用呢
其实c[]就是统计个数来确定的sa的次序的
这样倍增范围是不断增大，那么重复数也会慢慢变少，直到无重复(定义)

然后后面就是一堆处理来保证下一次操作的正常运行以及判断结束
还算好理解，嗯

代码

#include <bits/stdc++.h>
#define FOR(i,a,b) for(int i=a;i<=b;++i)
#define ROF(i,a,b) for(int i=a;i>=b;--i)
using namespace std;
const int maxn=1000050;
char s[maxn];
int n,m,x[maxn],rk[maxn],c[maxn],sa[maxn];
void get_SA()
{
    FOR(i,1,n) ++c[rk[i]=s[i]];
    //rk[i]是第i个元素的第一关键字 
    FOR(i,2,m) c[i]+=c[i-1]; 
    //做c的前缀和，我们就可以得出每个关键字最多是在第几名 
    ROF(i,n,1) sa[c[rk[i]]--]=i; 
    for(int k=1;k<=n;k<<=1) {
        int num=0;
        //@按照第二关键字进行排序
        FOR(i,n-k+1,n) x[++num]=i;
        FOR(i,1,n) if (sa[i]>k) x[++num]=sa[i]-k;
        FOR(i,1,m) c[i]=0;
        FOR(i,1,n) ++c[rk[i]];
        FOR(i,2,m) c[i]+=c[i-1];
        //@依次取出x[i]，按照第一关键字排序
        ROF(i,n,1) sa[c[rk[x[i]]]--]=x[i],x[i]=0;
        //@这里不用想太多，因为要生成新的rt时要用到旧的，就把旧的复制下来，没别的意思 
        swap(x,rk);
        //@制造新的rk
        rk[sa[1]]=1;num=1;
        FOR(i,2,n)
            rk[sa[i]]=(x[sa[i]]==x[sa[i-1]] && x[sa[i]+k]==x[sa[i-1]+k]) ? num : ++num;
        //判断
        if (num==n) break;
        m=num;
    }
    FOR(i,1,n) cout<<sa[i]<<" ";
}
int main()
{
    scanf("%s",s+1);
    n=strlen(s+1),m=122;
    get_SA();
    return 0;
}

全部评论

推荐最新楼层

11-27 16:00

北京交通大学 Python

发现前同事找了个好工作心态不平衡怎么办

他在这边试用期表现很差被开了 现在找了个更好的工作 他现在的公司同事刚好我也认识，也在吐槽他的工作水平很差 但是他已经转正了（说是懒得再招聘？？？）我真的好羡慕，还有一点嫉妒他（他现在公司待遇非常不错）

点赞评论收藏

11-29 16:09

湖南大学前端工程师

京东科技前端一面

自我介绍介绍一下SSE（项目）除了SSE还有什么实时通讯方式WebSocket和HTTP区别React类组件生命周期useEffect第二个参数是对象会怎样React组件间通信方式React高阶组件怎么使组件位置固定？怎么使组件不遮挡？怎么实现组件可拖拽？echarts组件在哪个生命周期实例化选择器选项懒加载怎么实现（项目）Vue-router原理怎么打开新页面git版本管理JSX、SCSS能直接运行吗？怎么构建？常用数组方法发网络请求有哪些方式fetch怎么中断请求HTTP请求头有哪些JS事件循环手撕防抖节流元素上下左右居中设置元素隐藏

查看24道真题和解析

点赞评论收藏

11-11 15:12

南昌大学材料工程师

完辣

211硕双非本，原来这么垃圾？投一次被拒一次，笑死。 #0offer是寒冬太冷还是我太菜#

一个菜鸡罢了：哥们，感觉你的简历还是有点问题的，我提几点建议，看看能不能提供一点帮助 1. ”新余学院“别加粗，课程不清楚是否有必要写，感觉版面不如拿来写一下做过的事情，教育经历是你的弱势就尽量少写 2. “干部及社团经历”和“自我评价”删掉 3. 论文后面的“录用”和“小修”啥的都删掉，默认全录用，问了再说，反正小修毕业前肯定能发出来 4. 工作经验和研究成果没有体现你的个人贡献，着重包装一下个人贡献

0offer是寒冬太冷还是我太菜

点赞评论收藏