关于通配符的单模式串匹配

引入

给你两个字符串 。询问 是否匹配。其中 含有通配符 可以匹配任意一种字符。

分析

如果我们使用最常见的字符串匹配算法 我们发现,对于 的处理是非常复杂度的。这个我们引入一个函数 。叫做字符串 的距离函数。那么我们定义 。这样如果我们把 看做完全匹配的话,如果 我们就把他定义为 。这样就完美的解决了通配符的问题。但是由于引入了一个二元函数。我们计算上式子需要的时间复杂度为 。考虑函数展开 如果我们定义 这样我们得到了一个卷积形式。通过 或者 优化。总的复杂度变为

代码

#include<bits/stdc++.h>
using namespace std;
const int N = 1910000,P = 998244353;
int limit = 1,L = 0,r[N];
char S[N],T[N];
int A[N],B[N],C[N];
vector<int> Ans;
int ksm(int a,int b) {
    int x = 1;for(;b;b>>=1,a=1LL*a*a % P) {
        if(b & 1) x = 1LL * a * x % P;
    }return x;
}
void NTT(int *a,int type) {
    for(int i = 1;i < limit;i++) if(i > r[i]) swap(a[r[i]],a[i]);
    for(int mid = 1;mid < limit;mid <<= 1) {
        int wn = ksm(3,(P-1)/(mid<<1));
        for(int i = 0;i < limit;i += (mid << 1)) {
            for(int j = 0,w = 1;j < mid;j++,w = 1LL * w * wn % P) {
                int x = a[i + j],y = 1LL * w * a[i + j + mid] % P;
                a[i + j] = (x + y) % P;a[i + j + mid] = (x - y + P) % P;
            }
        }
    }
    if(type == -1) {
        reverse(a+1,a+limit);int inv = ksm(limit,P-2);
        for(int i = 0;i < limit;i++) a[i] = 1LL * a[i] * inv % P;
    }
}
void Init() {memset(B,0,sizeof(B));memset(C,0,sizeof(C));}
int main() {
    int n,m;
    scanf("%d%d%s%s",&n,&m,S+1,T+1);
    reverse(S+1,S+1+n);
    while(limit <= m + n) limit <<= 1,L++;
    for(int i = 0;i < limit;i++) r[i]=(r[i>>1]>>1)|((i&1)<<(L-1));
    for(int i = 1;i <= n;i++) {
        if(S[i] != '*') C[i] = (S[i] - 'a' + 1) * (S[i] - 'a' + 1) * (S[i] - 'a' + 1);
        else C[i] = 0;
    }
    for(int i = 1;i <= m;i++) {
        if(T[i] != '*') B[i] = (T[i] - 'a' + 1);
        else B[i] = 0;
    }
    NTT(C,1);NTT(B,1);
    for(int i = 0;i < limit;i++) A[i] = (A[i] + (1LL * C[i] * B[i] % P)) % P;
    Init();
    for(int i = 1;i <= n;i++) {
        if(S[i] != '*') C[i] = (S[i] - 'a' + 1) * (S[i] - 'a' + 1);
        else C[i] = 0;        
    }
    for(int i = 1;i <= m;i++) {
        if(T[i] != '*') B[i] = (T[i] - 'a' + 1) * (T[i] - 'a' + 1);
        else B[i] = 0;        
    }
    NTT(C,1);NTT(B,1);
    for(int i = 0;i < limit;i++) A[i] = (A[i] - (2LL * C[i] * B[i] % P) + P) % P;
    Init();
    for(int i = 1;i <= n;i++) {
        if(S[i] != '*') C[i] = (S[i] - 'a' + 1);
        else C[i] = 0;        
    }
    for(int i = 1;i <= m;i++) {
        if(T[i] != '*') B[i] = (T[i] - 'a' + 1) * (T[i] - 'a' + 1) * (T[i] - 'a' + 1);
        else B[i] = 0;        
    }    
    NTT(C,1);NTT(B,1);
    for(int i = 0;i < limit;i++) A[i] = (A[i] + (1LL * C[i] * B[i] % P)) % P;
    NTT(A,-1);
    for(int i = n + 1;i <= m + 1;i++) {
        if(A[i] == 0) Ans.push_back(i - n);
//        cout << A[i] << endl;
    }
    printf("%d\n",Ans.size());
    for(auto p:Ans) printf("%d ",p);
    printf("\n");
    return 0;
}
数学 文章被收录于专栏

关于多项式

全部评论

相关推荐

10-05 23:02
东北大学 Java
我说句实话啊:那时候看三个月培训班视频,随便做个项目背点八股,都能说3 40w是侮辱价
点赞 评论 收藏
分享
Natrium_:这时间我以为飞机票
点赞 评论 收藏
分享
评论
2
1
分享
牛客网
牛客企业服务