KMP 入门

news/2025/3/24 20:25:28/文章来源:https://www.cnblogs.com/George222/p/18787680

前传:BF 算法

BF 算法即为暴力解法,一位一位向下匹配。

时间复杂度约为 \(O(n \times m)\)

KMP

KMP 算法的主要思想是利用部分匹配信息,避免重复匹配,提高字符串查找效率。

KMP 算法总时间复杂度是 \(O(n + m)\),匹配用时 \(O(n)\)

\(m\) 为模式串长度,\(n\) 为目标串长度。

KMP 算法第一步:构造 \(kmp\) 数组

思路

\(kmp_i\) 存储的是 模式串 \(s2_{1 \sim i}\) 的最长相同前后缀的长度。

例子如下:

字符串:`a b a b a`
kmp数组:0 0 1 2 3

aba,前后的 a 相同,故 \(kmp_3 = 1\)

ababa,前后的 aba 相同,故 \(kmp_5 = 3\)

代码理解

kmp[1] = 0;
int len1 = strlen(s1 + 1);
int len2 = strlen(s2 + 1);
int j = 0;
for (int i = 2; i <= len2; i++)
{while (j && s2[i] != s2[j + 1])j = kmp[j];if (s2[j + 1] == s2[i])j++;kmp[i] = j;
}
  • \(j\) 代表当前计算 \(kmp_i\) 时,前后缀匹配的长度。
  • 逻辑:
    • \(s2_i = s2_{j + 1}\),说明 \(j + 1\) 位置也能匹配前后缀相同,\(j \gets j + 1\) 并记录到 \(kmp_i\)
    • \(s2_i \neq s2_{j + 1}\),使用 \(j \gets kmp_j\) 回退,直到可以匹配或 \(j = 0\)

KMP 算法匹配过程

前面说过了:

KMP 算法的主要思想是利用部分匹配信息,避免重复匹配。

我们求相同前后缀就是为了更好的跳跃。

如图所示,由于前后缀相同,我们可以直接跳跃至后缀部分,省去中间部分一位位匹配。

此部分代码如下:

	j = 0;for (int i = 1; i <= len1; i++){while (j && s1[i] != s2[j + 1])j = kmp[j];if (s2[j + 1] == s1[i])j++;if (j == len2){cout << i - len2 + 1 << "\n";j = kmp[j];}}

P3375 AC 代码

#include <bits/stdc++.h>
using namespace std;char s1[1000005], s2[1000005];
int kmp[1000005];int main()
{cin >> s1 + 1;cin >> s2 + 1;kmp[1] = 0;int len1 = strlen(s1 + 1);int len2 = strlen(s2 + 1);int j = 0;for (int i = 2; i <= len2; i++){while (j && s2[i] != s2[j + 1])j = kmp[j];if (s2[j + 1] == s2[i])j++;kmp[i] = j;}j = 0;for (int i = 1; i <= len1; i++){while (j && s1[i] != s2[j + 1])j = kmp[j];if (s2[j + 1] == s1[i])j++;if (j == len2){cout << i - len2 + 1 << "\n";j = kmp[j];}}for (int i = 1; i <= len2; i++)cout << kmp[i] << " ";return 0;
}

后记

感谢能看到这里!

欢迎对本文提各种学术性的建议!

图较丑,比较糊,勿喷,谢谢。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/904154.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

web-CodeInject

<?php#Author: h1xaerror_reporting(0); show_source(__FILE__);eval("var_dump((Object)$_POST[1]);");eval("var_dump((Object)$_POST[1]);");:这行代码使用了eval()函数,这是一个非常危险的函数,因为它会执行传递给它的字符串作为PHP代码。这意味…

kettle插件-dm达梦数人大金仓Vastbase数据库插件

在国家大力倡导原创技术、推动信息技术应用创新(信创)的政策背景下,摆脱对国外技术的依赖、构建自主可控的信息技术体系成为重要发展方向。大数据作为信息技术的重要组成部分,国产大数据技术和产品迎来了前所未有的发展机遇。 信创旨在实现核心技术自主可控,保障国家信息安…

广义优势估计(GAE):端策略优化PPO中偏差与方差平衡的关键技术

广义优势估计(Generalized Advantage Estimation, GAE)由Schulman等人在2016年的论文中提出,是近端策略优化(PPO)算法的重要基础理论,也是促使PPO成为高效强化学习算法的核心因素之一。 GAE的理论基础建立在资格迹(eligibility traces)和时序差分λ(TD-λ)之上,为深入理解GA…

集合体系介绍、collection的使用--java进阶day09

1.集合体系结构 我们要学习的集合大体分为两种,一种是单列集合,一种是双列集合2.单列集合 单列集合又分为两个派系,分别为list接口和set接口,这两个接口皆是collection接口的子接口3.Collection接口既然要使用,那就必然要创建对象,但我们知道Collection是接口,不能实例化…

mybatis组件SqlSource的种类

SqlSource是mybatis重要的组件,是对你写的sql语句的简单封装。public interface SqlSource {BoundSql getBoundSql(Object parameterObject);}这个接口有很多种实现:VelocitySqlSource这个实现类是一个测试。实际上mybatis根本就不会使用这个实现类。 那么在mybatis内部是在哪…

静雅斋目录2

托管于国内企业顶想云的使用目录前情概要 本来已经有一个使用目录了,但是实在是受不了 GitHub 时不时卡壳的表现,就重新启用这个国内的搜索目录,外观要稍微差一点,但使用体验要好得多。 托管地址 托管于 顶想云 平台的目录样式 .编辑地址:顶想云.iframe-container { /* 容…

ARP高级欺骗-配置路由转发

引出问题: 当我们发起一次ARP欺骗之后,目标主机会出现断网情况。这种很容易就会被目标主机A发现。那我们怎么让目标主机发现不了自己被ARP欺骗了呢?问题描述: 1.受害主机A断网: 当目标主机A上网时,会进行TCP的连接,但是因为ARP欺骗之后,主机A的路由转发到的是主机B而不…

使用XIAO ESP32C6, XIAO扩展板和SHT31温湿度传感器构建温湿度计

我很高兴与您分享我的最新项目:我使用XIAO ESP32C6, XIAO扩展板和SHT31温湿度传感器构建的DIY温湿度计。我的目标是创造一种设备,可以帮助我监测家里的湿度水平,特别是因为我住在沿海热带地区,那里的湿度波动很大。这个想法来自于我需要保持一个舒适的室内环境。有时空气会…

可视化图解算法:判断一个链表是否为回文结构(回文链表)

对于链表的相关操作,我们总结了一套【可视化+图解】方法,依据此方法来解决链表相关问题,链表操作变得易于理解,写出来的代码可读性高也不容易出错。1. 题目 描述 给定一个链表,请判断该链表是否为回文结构。 回文是指该字符串正序逆序完全一致。 数据范围: 链表节点数 0≤…

使用ESP32和Gemini REST API语音输入调用带有自定义参数的函数

我们在建造什么? 在之前的教程中,我介绍了如何通过REST将ESP32连接到谷歌Gemini API以发送音频文件并对其进行转录。在本教程中,我将扩展到实际使用录制的音频而不是转录它-在这种情况下,打开和关闭LED环,加上根据语音命令改变LED的颜色。虽然我只是在操纵一个LED环,但你…

20244211 实验一《Python程序设计》实验报告

20244211 2024-2025-2 《Python程序设计》实验一报告 课程:《Python程序设计》 班级: 2442 姓名: 朱睿颖 学号:20244211 实验教师:王志强老师 实验日期:2025年3月18日 必修/选修: 专业选修课 1.实验内容熟悉Python开发环境; 练习Python运行、调试技能; 编写程序,练习…