2019-08-16 16:56 已编辑杭州电子科技大学研发工程师

关注

Acesrc and String Theory

前言

来提供一种跑得还行(1872ms)并且比较好想(连我这个刚知道启发式合并还不会敲的人都想到了)的 $nlog^2n$ 的做法。
比赛时启发式合并那部分交给队友敲了，这几天学了一波启发式合并自己试着敲了一发，就顺便来写个博客。

题意

大概就是给你一个字符串，让你统计有多少子串可以有k个相同的字符串首位相接得到。

思路

考虑每一个子串是否可以向后延伸k-1倍，如果可以，显然对答案贡献+1.
子串 $s[i...j]$ 能往后延伸当且仅当 $lcp(i,j+1)>=(k-1)*(j+1-i)$ 。
显然答案可以表示成 $\sum_{0<=i<n}\sum_{i<j<=n}[lcp(i,j)>=(k-1)*(j-i)]$ 。
即对于任意两个后缀，只要他们的 $lcp$ 大于 $(k-1)*(j-i)$ ，就会令答案+1。
我们反过来考虑，这等价于，对于任意两个前缀，只要他们的最长公共后缀大于 $(k-1)*(j-i)$ ，就会令答案+1。
两个前缀的最长公共后缀等于他们的节点在后缀自动机 $fail$ 树上的 $lca$ 的 $len$ 。
我们考虑一个节点 $u$ ，考虑以 $u$ 为 $lca$ 的后缀对答案的贡献，该贡献为以 $u$ 为 $lca$ 的 $endpos$ 对中有多少对之差的绝对值小于等于 $(len[u]/(k-1))$ 。
显然我们可以在启发式合并维护endpos集合的合并操作时统计这个贡献。
每次当我们把轻儿子的 $endpos$ 插入到重儿子的集合中时，可以统计对于轻儿子的每个 $endpos\quad j$ ，重儿子中有多少 $endpos \quad i$ 满足 $i \in [j-len[u]/(k-1),j+len[u]/(k-1)]$ ，这部分可以由树状数组完成，先统计整个轻儿子插入产生的贡献，再将整个轻儿子插入。
即启发式合并的复杂度 $nlogn$ 再乘上维护树状数组和查询的复杂度 $logn$ ，总的复杂度为 $nlog^2n$ 。
PS:k等于1要特判。

代码

#include <cstdio>
#include <algorithm>
#include <cstring>
using namespace std;
typedef long long ll;
const int N = 6e5+100;
char s[N];
int n,m,k;
struct SAM{
    int next[N][26],fa[N],len[N],endpos[N];
    int root,tot,last;ll ans;
    int newnode(int l){
        fa[tot]=-1; endpos[tot]=-1;
        for(int i=0;i<26;++i)  next[tot][i]=-1;
        len[tot++]=l; return tot-1;
    }
    void init(){
        tot=ans=0;
        last=root=newnode(0);
    }
    void extend(int x,int ep){
        int p=last; int cur=newnode(len[p]+1); endpos[cur]=ep;
        while(p!=-1&&next[p][x]==-1){
            next[p][x]=cur; p=fa[p];
        }
        if(p==-1) fa[cur]=root;
        else{
            int q=next[p][x];
            if(len[q]==len[p]+1) fa[cur]=q;
            else{
                int tmp = newnode(len[p]+1);
                memcpy(next[tmp],next[q],sizeof(next[q]));
                fa[tmp]=fa[q]; fa[q]=fa[cur]=tmp;
                while(p!=-1&&next[p][x]==q){
                    next[p][x]=tmp; p=fa[p];
                }
            }
        }
        last=cur;
    }
    int head[N],nex[N],to[N],tol;
    void build(){
        for(int i=0;i<tot;++i) head[i]=-1; tol=0;
        for(int i=1;i<tot;++i){
            to[tol]=i; nex[tol]=head[fa[i]];
            head[fa[i]]=tol; tol++;
        }
    }
    int bit[N>>1];
    int sum(int i){
        int s=0;
        while(i>0){
            s+=bit[i];
            i-=i&-i;
        }
        return s;
    }
    void add(int i,int x){
        while(i<=n){
            bit[i]+=x;
            i+=i&-i;
        }
    }
    int sz[N],son[N];
    void dfs1(int u){
        sz[u]=1; son[u]=-1;
        for(int i=head[u];~i;i=nex[i]){
            dfs1(to[i]); sz[u]+=sz[to[i]];
            if(son[u]==-1||sz[son[u]]<sz[to[i]]) son[u]=to[i];
        }
    }
    void dfs2(int u,int v){
        if(~endpos[u]) add(endpos[u],v);
        for(int i=head[u];~i;i=nex[i]) dfs2(to[i],v);
    }
    void dfs3(int u,int rt){
        if(~endpos[u]) ans+=sum(min(n,endpos[u]+len[rt]/k))-sum(max(0,endpos[u]-len[rt]/k-1));
        for(int i=head[u];~i;i=nex[i]) dfs3(to[i],rt);
    }
    void dfs4(int u,bool clean){
        for(int i=head[u];~i;i=nex[i]){
            if(to[i]==son[u]) continue;
            dfs4(to[i],true);
        }
        if(~son[u]) dfs4(son[u],false);
        if(~endpos[u]){
            ans+=sum(min(n,endpos[u]+len[u]/k))-sum(max(0,endpos[u]-len[u]/k-1));
            add(endpos[u],1);
        }
        for(int i=head[u];~i;i=nex[i]){
            if(to[i]==son[u]) continue;
            dfs3(to[i],u); dfs2(to[i],1);
        }
        if(clean) dfs2(u,-1);
    }
}sam;



int main(){
    int t; scanf("%d",&t);
    while(t--){
        scanf("%d %s",&k,s); n=strlen(s); k-=1; sam.init();
        if(k==0){
            printf("%lld\n",1LL*n*(n+1)/2); continue;
        }
        for(int i=0;i<n;++i) sam.extend(s[i]-'a',i+1);
        sam.build(); sam.dfs1(sam.root); sam.dfs4(sam.root,true);
        printf("%lld\n",sam.ans);
    }
}

全部评论

推荐最新楼层

杭州电子科技大学后端

%%%燕巨

点赞回复分享

发布于 2019-08-16 16:22

杭州电子科技大学 C++

%%%燕巨

点赞回复分享

发布于 2020-07-05 23:35

昨天 20:46

华南理工大学前端工程师

京东-测试开发面试

一、项目经验考核(20分钟) 1. 电商核心场景测试。“以你参与的电商订单系统测试为例,说明如何设计高并发场景下的测试方案/计划(需包含性能测试策略+数据一致性校验方法)”性能测试策略：1、负载测试：高并发2、压力：持续增加，测试系统的极限承载能力，验证系统的处理机制（平稳降级或者处理失败）3、稳定性：长时间的高并发4、吞吐量：每秒处理的请求数数据一致性校验：保证系统在高并发操作后，数据保持正确性1、数据库一致性校验：使用事务日志的审计功能，检查操作（订单创建、支付、付款）是否一致2、分布式系统一致性校验：数据在多个节点之间保持一致 redis集群模式、主从模式保证数据一致性3、使用消息...

查看13道真题和解析

点赞评论收藏

分享

02-24 15:24

哈尔滨工业大学（威海） Java

【面经】腾讯HR（S3事业群）后台开发暑期实习

时间线：25.2.12 收到面试通知25.2.13 第一次面试（体验良好），一小时后秒挂；再次投递25.2.14 再次收到这个部门的面试通知25.2.19 第二次面试（体验一般），一小时后秒挂腾讯HR 事业群，主要做人力资源相关项目的后台研发，据说有几百个项目在跑。2.13 技术一面 60min面试官还是很和蔼的，除了简单的自我介绍和简单介绍项目后，集中提问了Java基础八股，背的不熟悉还一顿给建议。算法LeetCode64 最小路径和 一个很简单的二维动态规划八股Java 开线程有几种方式？wait 和 sleep 有什么区别？（一个是 Thread 方法，另一个是 Object 方法）JV...

查看21道真题和解析

点赞评论收藏

分享

02-22 15:50

已编辑

中国地质大学（北京）后端

26级小登找实习

211本，有好心人帮看看简历吗，我感觉我会的还不少但是不知道往上面写什么有用😢。

点赞评论收藏

分享

02-19 14:27

四川大学嵌入式软件工程师

经纬恒润嵌入式软开HR面

面试公司：经纬恒润。面试岗位：嵌入式软开（HR面）。面试时间：2024.5.20 视频面，25min左右。自我介绍。可以实习多久，每周几天，啥时候可以入职。本科期间记忆最深刻的事情，怎么解决的。个人的优势和缺点。有因为这个缺点对现在造成什么影响吗。最近压力很大是什么时候，怎么调节的。最近遇到的最大困难，怎么解决的。如果面试通过了实习入职的话考虑转正吗。为什么要找实习。反问。面试体验：面完10min后就电话OC了，只能说润子虽然风评差但面试体验还算不错。整体HR面问题也比较常规，和秋招相比就是多了一些实习时间的考量。

查看9道真题和解析通信硬件人笔面经互助

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 如何缓解入职前的焦虑 #

139854次浏览 1109人参与

# 软件开发春招备战日记 #

54933次浏览 451人参与

# 水滴春招 #

67386次浏览 636人参与

# 机械人，秋招第一次笔试的企业是哪家？ #

24139次浏览 223人参与

# 总结:哪家公司面试体验感最好 #

29568次浏览 168人参与

# 来聊聊机械薪资天花板是哪家 #

101905次浏览 684人参与

# 掌阅春招 #

84252次浏览 320人参与

# 产品每日一题 #

28131次浏览 387人参与

# 听劝，这个简历怎么改 #

55558次浏览 560人参与

# 初创公司值得加入吗？ #

12600次浏览 67人参与

# 想给25届机械人的秋招建议 #

22053次浏览 199人参与

# 你最近一次加班是什么时候？ #

29656次浏览 237人参与

# 还记得你第一次面试吗？ #

72469次浏览 1043人参与

# 如果不考虑收入，你最想做什么工作？ #

17164次浏览 121人参与

# 职场上哪些行为很加分？ #

20411次浏览 481人参与

# 你今年的平均薪资是多少？ #

92596次浏览 448人参与

# 你的工资什么时候发？ #

19126次浏览 152人参与

# 计算机专业还有必要去大厂卷吗 #

16163次浏览 88人参与

# 上班苦还是上学苦呢？ #

199034次浏览 1203人参与

# 22届入职，工资很低，要辞职还是苟着 #

17919次浏览 118人参与

# 互联网行业现在还值得去吗 #

4027次浏览 33人参与

# 考研人，我有话说 #

5791次浏览 111人参与

牛客网
牛客企业服务