2020-07-23 10:42 门头沟学院运维工程师

关注

字符串匹配算法

https://baijiahao.baidu.com/s?id=1659735837100760934&wfr=spider&for=pc

BF算法是如何工作的？

正如同它的全称BruteForce一样，BF算法使用简单粗暴的方式，对主串和模式串进行逐个字符的比较：

第一轮，模式串和主串的第一个等长子串比较，发现第0位字符一致，第1位字符一致，第2位字符不一致：

第二轮，模式串向后挪动一位，和主串的第二个等长子串比较，发现第0位字符不一致：

第三轮，模式串继续向后挪动一位，和主串的第三个等长子串比较，发现第0位字符不一致：

以此类推，一直到第N轮：

当模式串挪动到某个合适位置，逐个字符比较，发现每一位字符都是匹配时，比较结束：

BF算法的缺点很明显，效率实在太低了，每一轮只能老老实实地把模式串右移一位，实际上做了很多无谓的比较。

而BM算法解决了这一问题。它借助“坏字符规则”和“好后缀规则”，在每一轮比较时，让模式串尽可能多移动几位，减少无谓的比较。

利用BM算法，上面的主串和模式串匹配只需要比较三轮：

KMP算法的整体思路

KMP算法的整体思路是什么样子呢？让我们来看一组例子：

KMP算法和BF算法的“开局”是一样的，同样是把主串和模式串的首位对齐，从左到右对逐个字符进行比较。

第一轮，模式串和主串的第一个等长子串比较，发现前5个字符都是匹配的，第6个字符不匹配，是一个“坏字符”：

这时候，如何有效利用已匹配的前缀 “GTGTG” 呢？

我们可以发现，在前缀“GTGTG”当中，后三个字符“GTG”和前三位字符“GTG”是相同的：

在下一轮的比较时，只有把这两个相同的片段对齐，才有可能出现匹配。这两个字符串片段，分别叫做最长可匹配后缀子串和最长可匹配前缀子串。

第二轮，我们直接把模式串向后移动两位，让两个“GTG”对齐，继续从刚才主串的坏字符A开始进行比较：

显然，主串的字符A仍然是坏字符，这时候的匹配前缀缩短成了GTG：

按照第一轮的思路，我们来重新确定最长可匹配后缀子串和最长可匹配前缀子串：

第三轮，我们再次把模式串向后移动两位，让两个“G”对齐，继续从刚才主串的坏字符A开始进行比较：

以上就是KMP算法的整体思路：在已匹配的前缀当中寻找到最长可匹配后缀子串和最长可匹配前缀子串，在下一轮直接把两者对齐，从而实现模式串的快速移动。

1. 对模式串预处理，生成next数组

2. 进入主循环，遍历主串

2.1. 比较主串和模式串的字符

2.2. 如果发现坏字符，查询next数组，得到匹配前缀所对应的最长可匹配前缀子串，移动模式串到对应位置

2.3.如果当前字符匹配，继续循环

全部评论

推荐最新楼层

AlexZhang12345

华中科技大学 golang

学习了😀

送花回复分享

发布于 2020-07-23 19:46

自救吧

06-28 14:58

已编辑

门头沟学院 C++

应届生被公司违约

如题，邻近毕业被公司违约。6月26日收到hr电话，说24届应届生全裁了，不用去报到了。然后hr给我寄了一份《解约函》，过了一天又给我寄了一份《解约函签收回执》，说把《解约函签收回执》寄给他们才给我付违约金。《解约函签收回执》签收回执里面写的“已于2024年6月26日解除《三方协议》”，钱都没付呢，怎么就已经解除了？有兄弟知道，我把《解约函签收回执》寄给他们了，还会给我赔违约金吗？引流：字节跳动，海康威视，深信服，腾讯，阿里巴巴，拼多多，滴滴，京东，小米，大疆，美团，好未来，小红书，华为，简历，offer，面试，面经，三方，国企，央企，秋招，应届生，求职，比亚迪，建设银行，工商银行，百度，中兴，...

点赞评论收藏

小兔子乖乖201811130658795

06-28 15:46

重庆邮电大学 C++

25届java后端开发，已老实，求简历指导

我的简历长这样简历被挂麻了，求建议

点赞评论收藏

坦荡的小学生在学c语言

05-02 13:39

莆田学院体育教师/老师

我这种的  想转行都转行不了  想找个工作 有没有人建议一下啊

点赞评论收藏

牛客867878807号

06-05 16:18

广东科技学院前端工程师

25届前端实习简历，二本软件工程专业，第一次写，求指点😿

点赞评论收藏

牛客863730605号

06-29 16:29

25实习面试后端开发

25第一次实习面试都需要准备什么

点赞评论收藏

1 6 评论

全站热榜

正在热议