算法打卡day8|字符串篇02|Leetcode 28. 找出字符串中第一个匹配项的下标、459. 重复的子字符串

 算法题

Leetcode  28. 找出字符串中第一个匹配项的下标

题目链接:28. 找出字符串中第一个匹配项的下标

大佬视频讲解:KMP理论篇

KMP代码篇

个人思路

当看到在一个串中查找是否出现过另一个串,那肯定是用kmp算法了; kmp比较难理解,详细理论和代码可以看上面参考;

按照个人理解 kmp就是帮忙在 查找串时减少不必要的检索;

用一个叫做前缀表(next)的数组先来找到 最长相等前后缀的位置, 然后 双指针检索 目标字符串,在源字符串 字母与目标字符串字母相同 时,往前走,不同时找前缀表对应位置回退;

解法
KMP算法

n为目标串长度,m为源串长度,因为在匹配的过程中,根据前缀表不断调整匹配的位置,可以看出匹配的过程是O(n),之前还要单独生成next数组,时间复杂度是O(m)。所以整个KMP算法的时间复杂度是O(n+m)的。而暴力的解法显而易见是O(n × m),所以KMP在字符串匹配中极大地提高了搜索的效率。

其中前缀表有多种方式生成,这里采用 不减一的情况.

class Solution {public int strStr(String haystack, String needle) {if (needle.length() == 0) return 0;int[] next = new int[needle.length()];getNext(next, needle);//用源串needle 生成前缀表int j = 0;for (int i = 0; i < haystack.length(); i++) {//遍历目标串while (j > 0 && needle.charAt(j) != haystack.charAt(i)) //字符不同时,按照前缀表回退 即从next数组里寻找下一个匹配的位置j = next[j - 1];if (needle.charAt(j) == haystack.charAt(i)) j++;//字符相同,那么i 和 j 同时向后移动//如果j指向了模式串t的末尾,那么就说明源串完全匹配目标串里的某个子串了if (j == needle.length()) return i - needle.length() + 1;//返回第一个匹配到串的位置}return -1;}//前缀表(不减一)private void getNext(int[] next, String s) {int j = 0;next[0] = 0;for (int i = 1; i < s.length(); i++) {//i从1开始才能与j开始对比while (j > 0 && s.charAt(j) != s.charAt(i)) // 前后缀不相同时j = next[j - 1];// 向前回退if (s.charAt(j) == s.charAt(i)) // 找到相同的前后缀j++;next[i] = j; // 将j(前缀的长度)赋给next[i]}}
}

时间复杂度:O(n+m);(双指针遍历字符串全部)

空间复杂度:O(m);(只需要保存字符串needle的前缀表)

Leetcode 459. 重复的子字符串

题目链接:459. 重复的子字符串

大佬视频讲解:459. 重复的子字符串

个人思路

思路不清晰

解法

移动匹配

题目难度主要在于如何分辨字符串是否能由子串重复构成;

当一个字符串s:godgod,内部由重复的子串组成,那么这个字符串的结构一定是这样的:

s是由前后相同的子串组成。那么既然前面有相同的子串,后面有相同的子串,用 s + s,这样组成的字符串中,后面的子串做前串,前面的子串做后串,就一定还能组成一个s,如图:

 

所以判断字符串s是否由重复子串组成,只要两个s拼接在一起,刨除 s + s 的首字符和尾字符(避免在s+s中搜索出原来的s), 里面还出现一个s的话,就说明是由重复子串组成.

class Solution {public boolean repeatedSubstringPattern(String s) {
//indexOf(s, 1)查找字符串 s 第一次出现的位置,从索引1开始搜索(即从原字符串的第二个字符开始搜索)return (s + s).indexOf(s, 1) != s.length();}
}

时间复杂度:O(n);(查找索引)

空间复杂度:O(1);(没使用辅助空间)

KMP算法

在一个串中查找是否出现过另一个串,这是KMP的看家本领;

先放结论, 数组长度减去最长相同前后缀的长度相当于是第一个周期的长度,也就是一个周期的长度,如果这个周期可以被整除,就说明整个数组就是这个周期的循环。

这样直接说有点抽象,举个例子:

next[len - 1] = 8,8就是此时字符串goodgoodgoodgood的最长相同前后缀的长度。(前缀不包括最后一个字符,后缀不包括第一个字符)

(len - (next[len - 1] )) 也就是: 12(字符串的长度) - 8(最长公共前后缀的长度) = 4, 4正好可以被 12(字符串的长度) 整除,所以说明有重复的子字符串(good)。

class Solution {public boolean repeatedSubstringPattern(String s) {if (s.equals("")) return false;int len = s.length();// 原串加个空格(哨兵),使下标从1开始,这样j从0开始,也不用初始化了s = " " + s;char[] chars = s.toCharArray();//字符串转换为字符数组int[] next = new int[len + 1];//前缀表// 构造 next 数组过程,j从0开始(空格),i从2开始for (int i = 2, j = 0; i <= len; i++) {// 匹配不成功,j回到前一位置 next 数组所对应的值while (j > 0 && chars[i] != chars[j + 1]) j = next[j];// 匹配成功,j往后移if (chars[i] == chars[j + 1]) j++;// 更新 next 数组的值next[i] = j;}// 判断是否是重复的子字符串if (next[len] > 0 && len % (len - next[len]) == 0) {return true;}return false;}
}

时间复杂度:O(n);(一个for循环)

空间复杂度:O(n);(next数组)

以上是个人的思考反思与总结,若只想根据系列题刷,参考卡哥的网址代码随想录算法官网代码随想录算法官网代码随想录算法官网

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/517956.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Midjourney入门:AI绘画真的能替代人类的丹青妙笔吗?

名人说&#xff1a;一花独放不是春&#xff0c;百花齐放花满园。——《增广贤文》 作者&#xff1a;Code_流苏(CSDN)&#xff08;一个喜欢古诗词和编程的Coder&#x1f60a;&#xff09; 目录 一、简要介绍1、Midjourney2、使用方法 二、绘画1、动物类2、风景类3、动漫类4、艺…

【记录处理Vue项目中Video.js播放不了MP4视频Bug】

记录处理Vue项目中Video.js播放不了MP4视频Bug 一、项目场景&#xff1a;二、问题描述三、原因分析&#xff1a;四、解决方案&#xff1a; 一、项目场景&#xff1a; 在Vue项目中使用Video.js播放MP4视频。 二、问题描述 在项目中使用Video.js播放MP4视频。视频采集上来存在数…

以太网帧格式

以太网帧格式 以太网帧格式前导码&#xff08;Preamble&#xff09;帧起始界定符&#xff08;SFD&#xff0c;Start Frame Delimiter&#xff09;以太网帧头目的MAC地址源MAC地址长度/类型 数据段帧检验序列&#xff08;FCS&#xff0c;Frame Check Sequence&#xff09;帧间隙…

实现连锁餐饮业务数字化管理:餐饮连锁管理APP开发思路与实践

在餐饮行业&#xff0c;尤其是餐饮连锁业务中&#xff0c;数字化管理更是刻不容缓。通过开发一款餐饮连锁管理APP&#xff0c;可以帮助餐饮连锁企业实现数字化管理&#xff0c;提升运营效率&#xff0c;优化服务体验&#xff0c;今天小编将给大家讲该APP的开发思路与实践。 一、…

[C#]winform基于C2PNet算法实现室内和室外图像去雾

【CP2Net框架】 https://github.com/YuZheng9/C2PNet 【CP2Net介绍】 Abstract 考虑到不适定的性质&#xff0c;发展了单图像去模糊的对比正则化&#xff0c;引入了来自负图像的信息作为下界。然而&#xff0c;对比样本是非一致的&#xff0c;因为阴性通常距离清晰&#xff…

Subversion svn 开源的版本控制系统入门介绍 VCS

拓展阅读 Subversion 开源的版本控制系统入门介绍 VCS Git 开源的版本控制系统-01-入门使用介绍 Git 开源的版本控制系统-02-base usage 基本用法 Git 开源的版本控制系统-03-时间数据回溯 Git 开源的版本控制系统-04-branch manage 分支管理 Git 开源的版本控制系统-05-…

ubuntu_定制文件系统[2]-清理日志log

1.问题现象 系统长时间运行, 产生大量的系统日志 ubuntu/debian 系统日志如下 /var/log$ du -sh * 31M syslog # syslog日志 61M syslog.1 2.5G journal/ # systemd service日志 当日志文件过大, 硬盘空间占用100%时, 导致各种异常 命令按tab补全无响应服务/进程启动异常服务…

疾控中心污水采样器自动采样——解放双手更轻松

疾控中心使用的污水采样器如今已经实现了自动化采样&#xff0c;这无疑给工作人员带来了极大的便利。这种设备能够完成污水取样、储存等环节&#xff0c;不再需要人工干预。这意味着工作人员可以解放双手&#xff0c;不再需要进行繁重的取样工作。 这种自动化的采样方式不仅减轻…

ArmSoM规划开发基于RK3576的开发套件

ArmSoM正计划推出一款新的产品&#xff0c;这款产品将采用强大的RK3576芯片。 本文将为您介绍我们的新产品搭载的RK3576性能参数&#xff0c;以及它如何为您提供卓越的性能和功能。 RK3576处理器 RK3576处理器是一款强大的处理器&#xff0c;具备出色的性能和多样化的功能&a…

回溯算法06-复原IP地址(Java/分割字符串)

6.复原IP地址 题目描述 有效 IP 地址 正好由四个整数&#xff08;每个整数位于 0 到 255 之间组成&#xff0c;且不能含有前导 0&#xff09;&#xff0c;整数之间用 . 分隔。 例如&#xff1a;"0.1.2.201" 和 "192.168.1.1" 是 有效 IP 地址&#xff0…

SAP PP学习笔记07 - 简单BOM,派生BOM,多重BOM,批量修改工具 CEWB

上一章讲了BOM的操作。 SAP PP学习笔记06 - BOM操作&#xff08;BOM 展开&#xff0c;BOM 使用先一览&#xff0c;BOM比较&#xff0c;批量更改BOM&#xff09;-CSDN博客 本章延续上一章&#xff0c;继续讲BOM操作。 主要讲 派生BOM&#xff0c;多重BOM&#xff0c;以及BOM批…

【python】对角线遍历

python系列文章目录 【python】基于cv2提取图片上的文本内容 【python】简单作图 【python】数组字符串等实用 【python】sort与sorted排序使用 【python】对角线遍历 python系列文章目录说明1.分析2.注意事项2.1 遍历2.2 区间2.3 顺序 3.代码实现 说明 给你一个大小为 m x n…