2020-07-23 10:42 门头沟学院运维工程师

关注

字符串匹配算法

https://baijiahao.baidu.com/s?id=1659735837100760934&wfr=spider&for=pc

BF算法是如何工作的？

正如同它的全称BruteForce一样，BF算法使用简单粗暴的方式，对主串和模式串进行逐个字符的比较：

第一轮，模式串和主串的第一个等长子串比较，发现第0位字符一致，第1位字符一致，第2位字符不一致：

第二轮，模式串向后挪动一位，和主串的第二个等长子串比较，发现第0位字符不一致：

第三轮，模式串继续向后挪动一位，和主串的第三个等长子串比较，发现第0位字符不一致：

以此类推，一直到第N轮：

当模式串挪动到某个合适位置，逐个字符比较，发现每一位字符都是匹配时，比较结束：

BF算法的缺点很明显，效率实在太低了，每一轮只能老老实实地把模式串右移一位，实际上做了很多无谓的比较。

而BM算法解决了这一问题。它借助“坏字符规则”和“好后缀规则”，在每一轮比较时，让模式串尽可能多移动几位，减少无谓的比较。

利用BM算法，上面的主串和模式串匹配只需要比较三轮：

KMP算法的整体思路

KMP算法的整体思路是什么样子呢？让我们来看一组例子：

KMP算法和BF算法的“开局”是一样的，同样是把主串和模式串的首位对齐，从左到右对逐个字符进行比较。

第一轮，模式串和主串的第一个等长子串比较，发现前5个字符都是匹配的，第6个字符不匹配，是一个“坏字符”：

这时候，如何有效利用已匹配的前缀 “GTGTG” 呢？

我们可以发现，在前缀“GTGTG”当中，后三个字符“GTG”和前三位字符“GTG”是相同的：

在下一轮的比较时，只有把这两个相同的片段对齐，才有可能出现匹配。这两个字符串片段，分别叫做最长可匹配后缀子串和最长可匹配前缀子串。

第二轮，我们直接把模式串向后移动两位，让两个“GTG”对齐，继续从刚才主串的坏字符A开始进行比较：

显然，主串的字符A仍然是坏字符，这时候的匹配前缀缩短成了GTG：

按照第一轮的思路，我们来重新确定最长可匹配后缀子串和最长可匹配前缀子串：

第三轮，我们再次把模式串向后移动两位，让两个“G”对齐，继续从刚才主串的坏字符A开始进行比较：

以上就是KMP算法的整体思路：在已匹配的前缀当中寻找到最长可匹配后缀子串和最长可匹配前缀子串，在下一轮直接把两者对齐，从而实现模式串的快速移动。

1. 对模式串预处理，生成next数组

2. 进入主循环，遍历主串

2.1. 比较主串和模式串的字符

2.2. 如果发现坏字符，查询next数组，得到匹配前缀所对应的最长可匹配前缀子串，移动模式串到对应位置

2.3.如果当前字符匹配，继续循环

全部评论

推荐最新楼层

AlexZhang12345

华中科技大学 golang

学习了😀

点赞回复分享

发布于 2020-07-23 19:46

04-20 22:23

广西大学算法工程师

完美世界 AI Agent开发一面

1. 自我介绍2. 介绍一下你的项目3. Coze 新旧两种编排方式的差异是什么，你在设计节点时怎么取舍拖拽式编排适合流程稳定、路径清晰、节点边界明确的场景，比如固定审批、FAQ 问答、标准化信息抽取。Agent 化编排更适合目标不稳定、路径动态变化、需要中间决策的场景，比如多轮任务执行、复杂信息搜集、跨工具协作。节点设计时不能按功能菜单式地乱拆，而要按状态边界和失败恢复边界去拆。一个节点如果既负责理解问题、又负责查知识、又负责生成结果，那一旦出错很难定位，也很难重试。真正稳的节点应该输入清晰、输出结构化、失败可恢复。4. 你写过哪些 MCP 工具，设计一个 MCP 工具协议时最关键的是什么M...

AI-Agent面试实战...

点赞评论收藏

04-19 11:28

重庆大学 Java

快手-二面-4.14

上来先写算法，让写个快排，磨蹭半天没写出来，问能不能写归并，结果归并半天也没写出来。然后让写个单例模式，也没写出来，到这里已经开始跟面试官对着尬笑了，到现在也没结果，应该是挂了讲一下 ConcurrentHashMap ？讲一下 ThreadLocal ？MyBatis 中 Mapper 接口为什么不需要实现类就可以直接调用？ （动态代理）秒杀场景中如何解决超卖问题？秒杀场景中如何解决少卖问题？如果 Redis 中库存数据丢失了该如何处理？介绍一下 RAG 的整体流程除了向量召回，还有哪些文档召回方式？当用户问题与文档语义相近但无法召回时如何优化？（对用户问题进行改写）MySQL 中常见的索引...

查看14道真题和解析

点赞评论收藏

04-20 17:49

郑州轻工业大学 Java

牛哥们，这简历行吗，找不到实习啊

点赞评论收藏

02-26 13:56

已编辑

重庆财经学院 Java

学院本真的没希望了吗😭秋招0offer，投了也石沉大海，求各位佬指点一下😭

King987：你有实习经历，但是写的也太简单了，这肯定是不行的，你主要要包装实习经历这一块，看我的作品，你自己包装一下吧，或者发我，我给你出一期作品

点赞评论收藏

04-20 09:19

武汉大学 C++

双非软工的破局之路

前言上数十年，今年是招聘环境最差的一年，但下数十年，今年有可能是招聘环境最好的一年。——来源秋招中遇到的不知名的某hr找工作本身就是运气+实力，甚至在菜鸡看来运气占比更高，有的时候不要总是怪自己（倒也不是为自己开脱哈），尽人事听天命，不要自己内耗。菜鸡在这里总结一下自己的整个一个找工作情况，一方面是从群众中来到群众中去，感谢找工作的时候中各位大佬们的资料与建议；另一方面是希望能为更多的小伙伴们提供微不足道的帮助。一、楼主自己情况菜鸡自己是来源于东三省某双非大学（排名很低的那种），本硕自动化，硕士研究方向是纯仿真（跟控制和编程无任何关系），无正式实习（导师派出去干过杂活），无高水平期刊论文，无高...

点赞评论收藏

全站热榜

创作者周榜

正在热议

# 简历上如何体现你的“AI”能力？ #

11435次浏览 266人参与

# 正在春招的你，也参与了去年秋招吗？ #

397469次浏览 2736人参与

# 华泰星战营，提前锁定校招offer #