KMP算法讲解

老规矩，讲算法前，先说一道小问题吧

给你一个长串和短串，求短串在长串中出现的次数和位置。

设长串长度为len1,短串长度为len2。

如果len1*len2<=10⁸，那就很简单了，直接暴力枚举以每个字符为开始的字符串是否匹配即可，复杂度为O(len1*len2);(是不是感觉太大了?)

如果将数据范围扩大到len1,len2<-10⁶呢？

现在就开始介绍我们的KMP算法。

有了前面的问题，KMP要解决的是什么就自然出来了，KMP的复杂度达到的耸人听问的O(len1+len2)。

我们可以想想我们相对于暴力算法需要改进什么？

我们可以每一次失配(也就是匹配失败)的时候，不用每一次都从上一次的出发点只往后移动一个字符，可以跳啊！

我们可以预处理出每一次跳的位置来有利于节省复杂度啊。

这里我们就讲一讲怎么跳，以及怎么进行预处理。

1.怎么跳？

我们假设字符串为abaaba

我们如果在第二个a时失配了，我们应该怎么往前呢？

我们就可以可以把第一个a放在这一个位置继续匹配。

那么，如果是第四个a呢？

我们是不是就可以把第二个a放在这个位置呢？

大家可以看到，第最后一个字符到第三个a的字符串是aba，而第一个字符到第二个a的字符串是不是也是aba，它们不是一样的吗？

讲到这里，大家应该大概的明白了KMP是怎么跳的了吧。

我们记一个nxt数组，nxt[i]表示的是从第一个字符到第i个字符的最长前后缀的长度。看不懂没关系，举个例子。

假设字符串为abaaba

nxt[0]=0

nxt[1]=0(ab无前后缀）

nxt[2]=1(aba最长前后缀为a)

nxt[3]=1(abaa-----a)

nxt[4]=0(abaab--无)

nxt[5]=3(abaaba-aba)

2.初始化

问题来了，怎么用很少的时间复杂度来进行初始化呢？

很容易想到递推，怎么递推呢？

我们假设求出了前面的nxt，现在多了一个，我们就应该找一找了。

我们可以跳前一个位置的nxt，直到跳到一个位置后面有一个字符是所需要的，是那里的后面那一个字符。

每个这样递推就好了！

而查找的过程与初始化的过程类似，这里就不再赘述了。

下面上一份模板代码

1 #include<iostream>
 2 #include<cstdio>
 3 #include<cstring>
 4 using namespace std;
 5 char s1[1000010],s2[1000100];
 6 int nxt[1000100];
 7 int main()
 8 {
 9     scanf("%s",s1);
10     scanf("%s",s2);
11     nxt[0]=0;
12     int len1=strlen(s1);
13     int len2=strlen(s2);
14     for(int i=1,k=0;i<len2;i++)
15     {
16         k=nxt[i-1];
17         while(k>0&&s2[k]!=s2[i])  k=nxt[k-1];
18         if(s2[k]==s2[i])  k++;
19         nxt[i]=k;
20     }
21     for(int i=0,j=0;i<len1;i++)
22     {
23         while(j!=0&&s1[i]!=s2[j])  j=nxt[j-1];
24         if(s1[i]==s2[j])  j++;
25         if(j==len2)
26         {
27             printf("%d\n",i-j+2);
28         }
29     }
30     for(int i=0;i<len2;i++) printf("%d ",nxt[i]);
31     return 0;
32 }

模板题：https://www.luogu.org/problemnew/show/3375

感谢大家的支持！

如果有不足之处，请尽管提出，本人不胜感激！

KMP算法讲解

算法少女

相关推荐

KMP算法：关于各个步骤的疑惑和思考

别再暴力匹配字符串了，高效的KMP才是真的香！

KMP 算法的两种实现

学习KMP算法时想到的另一种好方法

数据结构实验之串三：KMP应用（KMP模板）

字符串匹配算法之BF、KMP

KMP小扩展，找出子串在主串中出现的所有位置

数据结构实验之串三：KMP应用

关于KMP算法的理解

KMP算法及拓展KMP算法

Python实现字符串匹配的KMP算法

KMP算法思想及实现

结合kmp算法的匹配动画浅析其基本思想

KMP算法（1）：如何理解KMP

为虚拟机中的 openSUSE 12.1 安装 VBoxGuestAdditions 4.1.10

python3 kmp 字符串匹配的方法

JavaScript中数据结构与算法(五)：经典KMP算法

Python字符串匹配算法KMP实例

基于KMP算法JavaScript的实现方法分析

KMP算法用JavaScript实现

KMP 算法

【BZOJ】3670: [Noi2014]动物园（KMP）

字符串KMP || POJ 2185 Milking Grid

KMplayer常见问题整理(zt)

POJ 3461 kmp

KMP算法