Codeforces 547E - Mike and Friends(AC 自动机+树状数组)
阅读原文时间:2022年03月25日阅读:1

题面传送门

好久每做过 AC 自动机的题了……做几个题回忆一下罢

AC 自动机能够解决多串匹配问题,注意是匹配,碰到前后缀的问题那多半不在 AC 自动机能解决的范围内。

在初学 AC 自动机的时候相信大家都做过一道题叫做 P2414 [NOI2011] 阿狸的打字机。在这道题中我们用到了两棵树,一棵就是所有串的字典树,称为 trie 树,令一棵是求出每个点的 \(fail_i\) 后,对于所有不是根节点的 \(i\) 连边 \((fail_i,i)\) 后形成的树,称为 fail 树。

在那道题中我们学到了一个很重要的结论,那就是一个字符串 \(s\) 在另一个字符串 \(t\) 中出现的次数,等于 \(t\) 的结尾位置在 trie 树上的祖先中,有多少个在 \(s\) 的结尾位置在 fail 树的子树中。可以简单记为“模式串 fail 树向下,文本串 trie 树向上”。这个结论是解不少 AC 自动机与数据结构结合的题的基础。

那么我们就用这个结论来解这道题。首先建出 AC 自动机。我们考虑可以用差分的思想把一个询问拆成 \((l-1,k)\) 和 \((r,k)\) 两部分,二者相减得到答案。于是现在问题转化为处理形如“\(s_y\) 在前 \(x\) 个字符串中出现了多少次”,我们把这样的询问都挂到 \(x\) 上并动态地添加字符串。当我们加入一个字符串 \(s_i\) 的时候,假设 \(s_i\) 的结尾位置为 \(x\),由于 \(s_i\) 是文本串要在 trie 树上向上跳,我们就枚举 \(x\) 的所有祖先 \(y\) 并在 \(y\) 位置上加 \(1\),表示 \(y\) 节点的访问次数多了 $1$1。查询的时候就求出 \(s_k\) 的结尾位置在 fail 树中的子树中有多少个 \(1\),这个显然可以树状数组+DFS 序搞定。算下时间复杂度,显然对于一个字符串 \(i\),它在 trie 树上的祖先个数就是 \(|s_i|\),故我们最多在树状数组上加 \(\sum|s_i|\) 次,复杂度线对。

#include <bits/stdc++.h>
using namespace std;
#define fi first
#define se second
#define fz(i,a,b) for(int i=a;i<=b;i++)
#define fd(i,a,b) for(int i=a;i>=b;i--)
#define ffe(it,v) for(__typeof(v.begin()) it=v.begin();it!=v.end();it++)
#define fill0(a) memset(a,0,sizeof(a))
#define fill1(a) memset(a,-1,sizeof(a))
#define fillbig(a) memset(a,63,sizeof(a))
#define pb push_back
#define ppb pop_back
#define mp make_pair
template<typename T1,typename T2> void chkmin(T1 &x,T2 y){if(x>y) x=y;}
template<typename T1,typename T2> void chkmax(T1 &x,T2 y){if(x<y) x=y;}
typedef pair<int,int> pii;
typedef long long ll;
template<typename T> void read(T &x){
    x=0;char c=getchar();T neg=1;
    while(!isdigit(c)){if(c=='-') neg=-1;c=getchar();}
    while(isdigit(c)) x=x*10+c-'0',c=getchar();
    x*=neg;
}
const int MAXN=2e5;
const int MAXQ=5e5;
const int ALPHA=26;
int n,qu;string s[MAXN+5];
int ch[MAXN+5][ALPHA+2],fail[MAXN+5],ncnt=0,ed[MAXN+5],ans[MAXQ+5];
void insert(string s,int id){
    int cur=0;
    for(int i=0;i<s.size();i++){
        if(!ch[cur][s[i]-'a']) ch[cur][s[i]-'a']=++ncnt;
        cur=ch[cur][s[i]-'a'];
    } ed[id]=cur;
}
void getfail(){
    queue<int> q;
    for(int i=0;i<ALPHA;i++) if(ch[0][i]) q.push(ch[0][i]);
    while(!q.empty()){
        int x=q.front();q.pop();
        for(int i=0;i<ALPHA;i++){
            if(ch[x][i]){fail[ch[x][i]]=ch[fail[x]][i];q.push(ch[x][i]);}
            else ch[x][i]=ch[fail[x]][i];
        }
    }
}
int hd[MAXN+5],to[MAXN+5],nxt[MAXN+5],ec=0;
void adde(int u,int v){to[++ec]=v;nxt[ec]=hd[u];hd[u]=ec;}
int tim=0,bgt[MAXN+5],edt[MAXN+5];
void dfs(int x){bgt[x]=++tim;for(int e=hd[x];e;e=nxt[e]) dfs(to[e]);edt[x]=tim;}
int t[MAXN+5];
void add(int x,int v){for(int i=x;i<=(ncnt+1);i+=(i&(-i))) t[i]+=v;}
int query(int x){int ret=0;for(int i=x;i;i&=(i-1)) ret+=t[i];return ret;}
vector<pair<pii,int> > qv[MAXN+5];
int main(){
    scanf("%d%d",&n,&qu);for(int i=1;i<=n;i++) cin>>s[i],insert(s[i],i);
    getfail();for(int i=1;i<=ncnt;i++) adde(fail[i],i);dfs(0);
    for(int i=1;i<=qu;i++){
        int l,r,k;scanf("%d%d%d",&l,&r,&k);
        qv[r].pb(mp(mp(i,1),k));qv[l-1].pb(mp(mp(i,-1),k));
    }
    for(int i=1;i<=n;i++){
        int cur=0;
        for(int j=0;j<s[i].size();j++){
            cur=ch[cur][s[i][j]-'a'];add(bgt[cur],1);
        }
        ffe(it,qv[i]){
            int x=it->se,id=it->fi.fi,mul=it->fi.se;
            ans[id]+=mul*(query(edt[ed[x]])-query(bgt[ed[x]]-1));
        }
    }
    for(int i=1;i<=qu;i++) printf("%d\n",ans[i]);
    return 0;
}