算法------(13)KMP

例题:(1)AcWing 831. KMP字符串 

        。。其实写完也不太理解。。随便写点吧

        KMP就是求next数组和运用next的数组的过程。相比传统匹配模式一次更新一单位距离的慢速方法,next数组可以让下表字符串一次更新n - next【n】个距离,加快了匹配速度。next【i】记录的是某字符串的前i个字符中前缀与后缀最长的匹配长度。

        对于模版中的j,我的理解是已经匹配了j个字符,因此next【i】还可以理解为对于已经匹配了i个字符的字符串来说,假如后续匹配不成立,则该字符串至少还有next【i】个字符是匹配的。

#include <iostream>
#include <cstring>
#include <algorithm>
using namespace std;
const int N = 1e5+10,M = 1e6+10;
int ne[N];
int n,m;
char p[N],s[M];
int main()
{cin >> n >> p+1 >> m >> s+1;ne[1] = 0;for(int i = 2,j = 0;i<=n;i++){while(j && p[i] != p[j+1]) j = ne[j];if(p[i] == p[j+1]) j++;ne[i] = j;}for(int i = 1,j = 0;i<=m;i++){while(j && s[i] != p[j+1]) j = ne[j];if(s[i] == p[j+1]) j++;if(j == n){printf("%d ",i - n);j = ne[j];}}return 0;
}

练习:(1) Leetcode 459 重复的子字符串

        。。。好难啊!!!!这是easy???

        我们可以证明 非空字符串s可由一个子串重复多次构成 当且仅当 把两个s连接起来且去掉前面后面的各一个字符,其中仍然存在s作为新字符串的子串。 

        从前往后推很显然,从后往前推需要一定证明。显然我不会,摘抄一下Leetcode的答案。

(2) P1470 [USACO2.3] 最长前缀 Longest Prefix

         其实与KMP无关但不知道为什么加了个KMP的标签。。。没做出来。。

        跟之前做过的一些题目有些类似。dp[i]的含义为[0,i-1]个字母可以分解,因此我们枚举每一个j,只要满足[0,j-1]时能分解且[j,i-1]也在P集合内即可。对于查询[j,i-1],由于题目说P集合内字符串长度<=10,因此我们对每一个i只需要枚举10个j即可,这样大大优化了时间。

        以及不知为什么本地跑不了。。。(问了朋友可能是文件输入输出的关系)

#include <iostream>
#include <unordered_set>
#include <string>
using namespace std;
const int N = 2e5+10;
bool dp[N];
unordered_set<string> res;
int main(int argc, char** argv) {string ss;while(cin >> ss){if(ss == ".") break;res.insert(ss);}string ans = "";while(cin >> ss){ans += ss;}dp[0] = true;int n = ans.length();for(int i = 1;i<=n;i++){for(int j = i;j>=max(i-10,0);j--){if(dp[j] && (res.find(ans.substr(j,i-j))!=res.end())){dp[i] = true;continue;}}}for(int i = n;i>=0;i--){if(dp[i]){printf("%d",i);break;}}return 0;
}

(3) P3435 [POI2006] OKR-Periods of Words

        太难了太难了。。。

        一个前缀的最大周期长度就是其长度减去其最小匹配长度,也就是其最短的共同前后缀的长度。 next数组求的是最大匹配长度,而不断递归求next数组得到的正是不为0的最小匹配长度。递归处理时可以把next数组直接更新为求得的最短长度,这样求取速度会更快。

#include <iostream>
using namespace std;
typedef long long ll;
const int N = 1000010;
char str[N];
int ne[N];
int main(int argc, char** argv) {int n;scanf("%d%s",&n,str+1);ne[1] = 0;for(int i = 2,j = 0;i<=n;i++){while(j && str[i] != str[j+1]) j = ne[j];if(str[i] == str[j+1]) j++;ne[i] = j;}ll ans = 0;for(int i = 2,j = 2;i<=n;i++,j = i){while(ne[j]) j = ne[j];if(ne[i]) ne[i] = j;ans += i-j;}printf("%lld",ans);return 0;
}

(4) Leetcode 面试题17.17 多次搜索

          对每一个smalls内的字符串求next数组,然后与big字符串进行kmp匹配。注意kmp的i返回的是字符串的最后一个字符下标。以及每一次匹配都要先清空next数组。

class Solution {int ne[1010];vector<vector<int>> res;
public:void next(string str){char x[1010];int n = str.length();for(int i = 1;i<=n;i++) x[i] = str[i-1]; for(int i = 2,j = 0;i<=n;i++){while(j && x[i] != x[j+1]) j = ne[j];if(x[i] == x[j+1]) j++;ne[i] = j;}}vector<int> get(string a,string b){char x[1010],y[1010];int n = a.length(),m = b.length();for(int i = 1;i<=n;i++) x[i] = a[i-1];for(int i = 1;i<=m;i++) y[i] = b[i-1];vector<int> ans;for(int i = 1,j = 0;i<=n;i++){while(j && x[i] != y[j+1]) j = ne[j];if(x[i] == y[j+1]) j++;if(j == m){ans.push_back(i-m);j = ne[j];}}return ans;}vector<vector<int>> multiSearch(string big, vector<string>& smalls) {int n = smalls.size();for(int i = 0;i<n;i++){if(smalls[i] == ""){res.push_back({});continue;}memset(ne,0,sizeof(ne));next(smalls[i]);res.push_back(get(big,smalls[i]));}return res;}
};

(5) Leetcode 3036 匹配模式数组的子数组数目

        做出来的第一个Hard题!虽然完全不是自己想出来的!!。。。

        把nums转化为跟pattern数组一样模式的长度为n-1的数组,此题便转化为求nums数组中有几个子数组为pattern数组,这样一来直接用kmp匹配即可。转化这一步还是挺难想到的。

class Solution {int x[1000100],y[1000100],ne[1000100];// x,y 1-n
public:int countMatchingSubarrays(vector<int>& nums, vector<int>& pattern) {int n = nums.size()-1,m = pattern.size();for(int i = 0;i<n;i++){if(nums[i] < nums[i+1]) x[i+1] = 1;else if(nums[i] == nums[i+1]) x[i+1] = 0;else x[i+1] = -1;} for(int i = 1;i<=m;i++){y[i] = pattern[i-1];} for(int i = 2,j = 0;i<=m;i++){while(j && y[i] != y[j+1]) j = ne[j];if(y[i] == y[j+1]) j++;ne[i] = j; }int ans = 0;for(int i = 1,j = 0;i<=n;i++){while(j && x[i] != y[j+1]) j = ne[j];if(x[i] == y[j+1]) j++;if(j == m){ans++;j = ne[j];}}return ans;}
};

(6) Leetcode 3037.在无限流中寻找模式

         做出的第二道Hard题,想出了匹配方式但是在优化上栽了!不过还算可以!

        由于是无限流,所以每次更新就匹配一次肯定会超时,因此用vector处理,由于next数组是确定的,因此每次不用从头匹配,只需要一个一个进行匹配即可。

/*** Definition for an infinite stream.* class InfiniteStream {* public:*     InfiniteStream(vector<int> bits);*     int next();* };*/
class Solution {int ne[110000];vector<int> p,q;
public:int findPattern(InfiniteStream* stream, vector<int>& pattern) {p.push_back(0);q.push_back(0);int r = 0,m = pattern.size();for(int i = 1;i<=m;i++){q.push_back(pattern[i-1]);}for(int i = 2,j = 0;i<=m;i++){while(j && q[i] != q[j+1]) j = ne[j];if(q[i] == q[j+1]) j++;ne[i] = j;}int i = 1,j = 0;while(1){p.push_back(stream->next());while(j && p[i] != q[j+1]) j = ne[j];if(p[i] == q[j+1]) j++;if(j == m) return i-m;i++;}}
};

(7) Leetcode 3008.找出数组中的美丽下标

         Hard被卡了。。

        匹配用kmp,后续查找时的优化思路为对a中每一个下标数组,在b的下标数组二分查找第一个大于等于它的数,如果这个数存在则返回其与a中对应下标的差,和其前面一个与a中对应下标的差,如果满足则返回。

class Solution {char p[500100],q[500100],r[500010];int ne1[500100],ne2[500100];
public:vector<int> beautifulIndices(string s, string a, string b, int k) {vector<int> res;vector<int> res1,res2;int n = a.length(),m = b.length(),o = s.length();for(int i = 1;i<=n;i++) p[i] = a[i-1];for(int i = 1;i<=m;i++) q[i] = b[i-1];for(int i = 1;i<=o;i++) r[i] = s[i-1];for(int i = 2,j = 0;i<=n;i++){while(j && p[i] != p[j+1]) j = ne1[j]; if(p[i] == p[j+1]) j++; ne1[i] = j;}for(int i = 2,j = 0;i<=m;i++){while(j && q[i] != q[j+1]) j = ne2[j]; if(q[i] == q[j+1]) j++; ne2[i] = j;}for(int i = 1,j = 0;i<=o;i++){while(j && r[i] != p[j+1]) j = ne1[j]; if(r[i] == p[j+1]) j++; if(j == n){res1.push_back(i-n);j = ne1[j];} }for(int i = 1,j = 0;i<=o;i++){while(j && r[i] != q[j+1]) j = ne2[j]; if(r[i] == q[j+1]) j++; if(j == m){res2.push_back(i-m);j = ne2[j];} }int c1 = res1.size(),c2 = res2.size();for (int i: res1) {auto it = lower_bound(res2.begin(), res2.end(), i);if (it != res2.end() && *it - i <= k ||it != res2.begin() && i - *--it <= k) {res.push_back(i);}}return res;}
};

(8) Leetcode 758.字符串中的加粗单词

         没啥难的。。挑错时间太长所以贴上来羞辱一下自己。。

        kmp加合并区间。首先先对words每一个字符串求next然后与s进行匹配,求出每一个需要加粗的区间。由于这些区间存在重叠而导致标签数过多,因此要求最小的标签数就需要合并区间。

class Solution {int ne[15];typedef pair<int,int> pii;
public:vector<pii> segs;vector<char> init(string x){vector<char> p;p.push_back(0);int n = x.length();for(int i = 1;i<=n;i++) p.push_back(x[i-1]);return p;}void next(vector<char> x){int n = x.size()-1;for(int i = 2,j = 0;i<=n;i++){while(j && x[i] != x[j+1]) j = ne[j];if(x[i] == x[j+1]) j++;ne[i] = j;}}void kmp(vector<char> x,vector<char> y){int n = x.size() - 1,m = y.size() - 1;for(int i = 1,j = 0;i<=n;i++){while(j && x[i] != y[j+1]) j = ne[j];if(x[i] == y[j+1]) j++;if(j == m){segs.push_back({i-m,i-1});j = ne[j];}}}string boldWords(vector<string>& words, string s) {int n = words.size();auto p = init(s);for(int i = 0;i<n;i++){memset(ne,0,sizeof(ne));auto q = init(words[i]);next(q);kmp(p,q);}vector<pii> res;sort(segs.begin(),segs.end());int fs = -2e9,ed = -2e9;for(auto seg:segs){int l = seg.first,r = seg.second;if(ed+1<l){if(fs!=-2e9) res.push_back({fs,ed});fs = l;ed = r;}else{ed = max(ed,r);}}if(fs!=-2e9) res.push_back({fs,ed});int flag = 0;string ans = "";for(auto seg:res){int l = seg.first,r = seg.second;ans += s.substr(flag,l - flag);ans += "<b>";ans += s.substr(l,r-l+1);ans += "</b>";flag = r+1;}n = s.length();cout <<flag;if(flag < n ) ans += s.substr(flag,n-flag);return ans;}
};

 (9) P2375 [NOI2014] 动物园           很难,虽然写出来了但并不完全理解。。

           在求取next数组的过程中,我们可以求取每一个i所对应的有相同的前后缀的所有子串的个数,然后再进行一次匹配,当我们递归到子串长度不重叠时,就可以得到该长度下所有的不重叠的子串有相同前后缀的个数。

#include <iostream>
#include <cstring>
using namespace std; 
const int N = 1e6+10,mod = 1e9+7;
typedef long long ll;
char p[N];
int ne[N],nums[N];
int main(int argc, char** argv) {int t;scanf("%d",&t);while(t--){scanf("%s",p+1);int n = strlen(p+1);nums[1] = 1;for(int i = 2,j = 0;i<=n;i++){while(j && p[i] != p[j+1]) j = ne[j];if(p[i] == p[j+1]) j++;ne[i] = j;nums[i] = nums[ne[i]] + 1;}ll res = 1;for(int i = 1,j = 0;i<=n;i++){while(j && p[i]!=p[j+1]) j = ne[j];if(p[i] == p[j+1]) j++;while(j * 2 > i) j = ne[j]; res = res * (nums[j] + 1) % mod;}printf("%lld\n",res);for(int i = 1;i<=n;i++){ne[i] = 0;nums[i] = 0;} }return 0;
}

 

        

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/504894.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【研发日记】Matlab/Simulink技能解锁(三)——在Stateflow编辑窗口Debug

文章目录 前言 State断点 Transition断点 条件断点 按State步进 Watch Data Value Sequence Viewer 分析和应用 总结 前言 见《【研发日记】Matlab/Simulink技能解锁(一)——在Simulink编辑窗口Debug》 见《【研发日记】Matlab/Simulink技能解锁(二)——在Function编辑…

MATLAB图像噪声添加与滤波

在 MATLAB 中添加图像噪声和进行滤波通常使用以下函数&#xff1a; 添加噪声&#xff1a;可以使用imnoise函数向图像添加各种类型的噪声&#xff0c;如高斯噪声、椒盐噪声等。 滤波&#xff1a;可以使用各种滤波器对图像进行滤波处理&#xff0c;例如中值滤波、高斯滤波等。 …

基于CNN-LSTM-Attention的时间序列回归预测matlab仿真

目录 1.算法运行效果图预览 2.算法运行软件版本 3.部分核心程序 4.算法理论概述 4.1卷积神经网络&#xff08;CNN&#xff09;在时间序列中的应用 4.2 长短时记忆网络&#xff08;LSTM&#xff09;处理序列依赖关系 4.3 注意力机制&#xff08;Attention&#xff09; 5…

JVM垃圾回收详解

JVM垃圾回收详解 JavaGuide JDK7版本以及JDK7版本之前&#xff0c;堆内存通常分为下面三部分&#xff1a; 新生代&#xff08;年轻代&#xff09;内存老年代永久代 下图中的Eden区、两个S区S0、S1都属于新生代 JDK8版本之后永久代被元空间取代&#xff0c;元空间使用的是直…

洛谷题单_递推与递归

P1255 数楼梯 - 洛谷 | 计算机科学教育新生态 (luogu.com.cn) //不满分做法&#xff1a;没有高精度 #include <bits/stdc.h> using namespace std; const int N5006; int dp[N];//dp[i]表示到第i节楼梯有dp[i]中方案 int main(){int n;cin>>n;dp[1]1;dp[0]1;for(i…

Docker实战——网络通信

目录 一、Docker 容器网络通信的基本原理1、查看 Docker 容器网络&#xff08;1&#xff09;新建一个 Dockerfile文件&#xff0c;内容如下&#xff1a;&#xff08;2&#xff09;使用以下命令创建镜像&#xff08;3&#xff09;基于 debian 的镜像创建一个容器&#xff0c;并进…

[C++]AVL树怎么转

AVL树是啥 一提到AVL树&#xff0c;脑子里不是旋了&#xff0c;就是悬了。 AVL树之所以难&#xff0c;并不是因为结构难以理解&#xff0c;而是因为他的旋转。 AVL树定义 平衡因子&#xff1a;对于一颗二叉树&#xff0c;某节点的左右子树高度之差&#xff0c;就是该节点的…

第三百七十八回

文章目录 1. 概念介绍2. 实现方法2.1 maskFilter2.2 shader 3. 代码与效果3.1 示例代码3.2 运行效果 4. 内容总结 我们在上一章回中介绍了"两种阴影效果"相关的内容&#xff0c;本章回中将介绍如何绘制阴影效果.闲话休提&#xff0c;让我们一起Talk Flutter吧。 1. 概…

【C++庖丁解牛】类与对象

&#x1f4d9; 作者简介 &#xff1a;RO-BERRY &#x1f4d7; 学习方向&#xff1a;致力于C、C、数据结构、TCP/IP、数据库等等一系列知识 &#x1f4d2; 日后方向 : 偏向于CPP开发以及大数据方向&#xff0c;欢迎各位关注&#xff0c;谢谢各位的支持 目录 1.面向过程和面向对象…

构建大语言模型的四个主要阶段

大规模语言模型的发展历程虽然只有短短不到五年的时间&#xff0c;但是发展速度相当惊人&#xff0c;国内外有超过百种大模型相继发布。中国人民大学赵鑫教授团队在文献按照时间线给出 2019 年至 2023 年比较有影响力并且模型参数量超过 100 亿的大规模语言模型。大规模语言模型…

基于雷达影像的洪水监测技术方法详解

洪水发生时候大多数是阴雨天气&#xff0c;光学影像基本上拍不到有效影像。雷达影像这时候就能发挥其不受天气影像的优点。现在星载的雷达卫星非常多&#xff0c;如高分三号、陆探一号、海丝一号&#xff08;巢湖一号&#xff09;、哨兵1号等。本文以哨兵1号L1地距(GRD)产品来介…

【初中生讲机器学习】13. 决策树算法一万字详解!一篇带你看懂!

创建时间&#xff1a;2024-03-02 最后编辑时间&#xff1a;2024-03-02 作者&#xff1a;Geeker_LStar 你好呀~这里是 Geeker_LStar 的人工智能学习专栏&#xff0c;很高兴遇见你~ 我是 Geeker_LStar&#xff0c;一名初三学生&#xff0c;热爱计算机和数学&#xff0c;我们一起加…