LeetCode题集-3 - 无重复字符的最长子串

news/2024/12/21 19:59:06/文章来源:https://www.cnblogs.com/hugogoos/p/18405351

题目:给定一个字符串 s ,请你找出其中不含有重复字符的最长子串的长度。

我们先来好好理解题目,示例1中怎么得到长度为3的?

如果以第一个字符a为起始,不含重复的最长子串是abc;则我们这样表示(a)bcabcbb -> (abc)abcbb,如此表达枚举出所有可能的情况如下:

1.(a)bcabcbb -> (abc)abcbb;

2.a(b)cabcbb -> a(bca)bcbb;

3.ab(c)abcbb -> ab(cab)cbb;

4.abc(a)bcbb -> abc(abc)bb;

5.abca(b)cbb -> abca(bc)bb;

6.abcab(c)bb -> abcab(cb)b;

7.abcabc(b)b -> abcabc(b)b;

8.abcabcb(b) -> abcabcb(b);

在所有可能的情况中满足条件的最长的子串分别为abc、bca、cab三个,三个长度都是3,因此示例1的结果为3。

01、解法一、双指针法

通过上面枚举出的所有情况,可以发现满足要求的字串是从起始位置向结束位置滚动的,并且在这个过程中,字串的长度也是在变化的,那也就是说只要我们准备两个指针start和end,并控制好两个指针前进的节奏就可以完成任务。

那如何控制指针节奏呢?

首先说第二个指针end,我们把上面1.(a)bcabcbb -> (abc)abcbb中步骤进行补充,应该是1.(a)bcabcbb -> (ab)cabcbb -> (abc)abcbb即指针end一步一步往后走,即使遇到重复字符依旧稳步前进。

每当指针end往后移动一位,只需判断这一位有没有在之前的字串中出现过,如果出现过则开始调整指针start。

例如上面的1->2即(abc)abcbb -> a(bca)bcbb过程中,当指针end到第二个a时,而前面的子串abc中已经出现过a了,因此需要把指针start跳转到b即跳转到子串中重复字符后一个位置。

我们用图例详细描述一下从指针end移动到start移动的具体过程。

下面看看具体实现代码。

public static int SlidingWindow(string s)
{//start指针var startIndex = 0;//end指针var endIndex = 0;//当前不重复子串长度var currentLength = 0;//最长不重复子串长度var maxLength = 0;//一直处理直到end指针不小于字符串长度while (endIndex < s.Length){//获取待处理字符var pendingChar = s[endIndex];//判断待处理字符串是否在当前子串中存在for (var i = startIndex; i < endIndex; i++){//如果子串中已经存在待处理字符if (pendingChar == s[i]){//把start指针跳转至子串中重复字符下一个位置startIndex = i + 1;//重新计算当前不重复子串长度currentLength = endIndex - startIndex;break;}}//end指针向后移动一位endIndex++;//当前不重复子串长度加1currentLength++;//比较并更新最大不重复子串长度if (currentLength > maxLength){maxLength = currentLength;}}return maxLength;
}

分析可知,因为是双层循环while+for所以算法时间复杂度是:O(N2),又因为没有引用额外的空间因此空间复杂度是:O(1)。

02、解法二、双指针+哈希法

对于双层循环我们还是有办法进行优化的,最常见的做法是空间换时间,即把内层循环通过哈希表替换换掉,这样通过哈希表提供O(1)查询时间复杂度,使得整个算法时间复杂度达到O(N)。但是哈希表需要额外的O(N)空间

如果用哈希表存储已经存在字符,应该如何存储呢?key存什么?value存什么?这里有一个问题是哈希表只存当前子串的字符?还是存所有已存在字符?如果只存当前子串的字符意味着每次都要清除哈希表,而且清除动作时间复杂度是O(N)。所以我们选择存所有已存在字符。

如果存所有已存在字符,则要注意判断无效数据,比如abc(ba)b中我们不能把最后一个b和第一个b比较,因为当前子串是(ba),所以应该和第二个b做判断。

实现代码如下:

public static int SlidingWindowDictionary(string s)
{//start指针var startIndex = 0;//end指针var endIndex = 0;//当前不重复子串长度var currentLength = 0;//最长不重复子串长度var maxLength = 0;//字典表,存储已存在字符var dic = new Dictionary<char, int>();//一直处理直到end指针不小于字符串长度while (endIndex < s.Length){//获取待处理字符var pendingChar = s[endIndex];//判断待处理字符是否在字典表中存在,并且其索引位置在当前子串中if (dic.TryGetValue(pendingChar, out var value) && value >= startIndex){//把start指针跳转至子串中重复字符下一个位置startIndex = value + 1;//重新计算当前不重复子串长度currentLength = endIndex - startIndex;}//更新字典表已存在字符最后的索引位置dic[pendingChar] = endIndex;//end指针向后移动一位endIndex++;//当前不重复子串长度加1currentLength++;//比较并更新最大不重复子串长度if (currentLength > maxLength){maxLength = currentLength;}}return maxLength;
}

03、解法三、双指针+数组法

那这个算法还有优化空间吗?我们知道哈希表操作是有消耗的,有没有比哈希表更好的存储方式呢?

针对不同的问题可能有不同的方式,对于这一题,的确有点特别,不知道有没有注意到题目最下面的“s 由英文字母、数字、符号和空格组成”描述,这不由的让我想到ASCII码表。

如果是s是由ASCII码表里的字符组成,那么就代表每一个字符都有一个对应的十进制值,这就是天然的下标,然后以所有的ASCII码表数量构建一个字符数组用来存放已经存在的字符,而每个字符存放位置就是其对应的十进制值,这样不就可以解决存储的问题了吗?

因为我们先构建了数组,因此还需要给数组每个元素赋值为-1,用来标记当前元素还没有使用。

具体实现代码如下:

public static int SlidingWindowArray(string s)
{//start指针var startIndex = 0;//end指针var endIndex = 0;//当前不重复子串长度var currentLength = 0;//最长不重复子串长度var maxLength = 0;//定义可能存在的字符数组,并全部填充为-1var arr = new int[128];Array.Fill(arr, -1);//一直处理直到end指针不小于字符串长度while (endIndex < s.Length){//获取待处理字符var pendingChar = s[endIndex];//判断待处理字符索引位置是否在当前子串内if (arr[pendingChar] >= startIndex){//把start指针跳转至子串中重复字符下一个位置startIndex = arr[pendingChar] + 1;//重新计算当前不重复子串长度currentLength = endIndex - startIndex;}//更新数组中已存在字符最后的索引位置arr[pendingChar] = endIndex;//end指针向后移动一位endIndex++;//当前不重复子串长度加1currentLength++;//比较并更新最大不重复子串长度if (currentLength > maxLength){maxLength = currentLength;}}return maxLength;
}

虽然已经实现了三种解题方法,但是到底性能如何?下面我们对三个方法进行一组基准测试,每个方法测试10000次,每次随机构建一个长度为10000的字符串。

可以发现双指针+哈希表比单纯的双指针性能还有差很多,而双指针+数组整体表现就好很多了。由此可见双指针+哈希表还是有其局限性的,虽然理论值很好,但是实际表现不尽如人意,这也提醒我们要在合适的地方使用合适的方法,才能更好的解决问题。

测试方法代码以及示例源码都已经上传至代码库,有兴趣的可以看看。https://gitee.com/hugogoos/Planner

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/794669.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2-5Java多态

Java 多态 多态是同一个行为具有多个不同表现形式或形态的能力。 多态就是同一个接口,使用不同的实例而执行不同操作,如图所示:多态性是对象多种表现形式的体现。 现实中,比如我们按下 F1 键这个动作:如果当前在 Flash 界面下弹出的就是 AS 3 的帮助文档; 如果当前在 Wor…

【VMware by Broadcom】Fusion 产品下载汇总

Fusion 产品下载汇总(百度网盘)-『2024年9月9日更新』Fusion 产品版本 百度网盘VMware-Fusion-1.0.0-51348.dmg 链接:https://pan.baidu.com/s/1C8Qkr6nwV5rKrhpsv2JJ_A?pwd=t0kjVMware-Fusion-1.1.0-62573.dmgVMware-Fusion-1.1.1-72241.dmgVMware-Fusion-1.1.2-87978.dmg…

C#/.NET/.NET Core技术前沿周刊 | 第 4 期(2024年9.1-9.8)

前言 C#/.NET/.NET Core技术前沿周刊,你的每周技术指南针!记录、追踪C#/.NET/.NET Core领域、生态的每周最新、最实用、最有价值的技术文章、社区动态、优质项目和学习资源等。让你时刻站在技术前沿,助力技术成长与视野拓宽。欢迎投稿,推荐或自荐优质文章/项目/学习资源等。…

51nod 1051 最大子矩阵和

51nod 1051 最大子矩阵和 可以用前缀和容斥优化到 \(O(n^4)\),但是不够进行如下图操作:将每一列的数值都压缩到一维的数组上,就转换为求最大字段和问题,时间复杂度 \(O(n^3)\)。 看看代码就知道了。 #include <bits/stdc++.h> using namespace std; #define ll long …

VS中如何将本地代码上传到码云仓库

VS中如何将本地代码上传到码云仓库 方式一:点击“添加到源代码管理”VS底部栏点击“添加到源代码管理”,并选择“Git”选项在弹出窗口中,选择“其他→现有远程”选项,在右侧区域找到“远程URL”输入框,输入Gitee仓库地址,然后点击“创建并推送”按钮。此时项目目录会多出…

Linux下网络丢包故障定位

转载: 云网络丢包故障定位全景指南 硬件网卡丢包 Ring Buffer溢出如图所示,物理介质上的数据帧到达后首先由NIC(网络适配器)读取,写入设备内部缓冲区 Ring Buffer中,再由中断处理程序触发 Softirq 从中消费,Ring Buffer 的大小因网卡设备而异。当网络数据包到达(生产)…

第一次个人编程作业

github地址这个作业属于哪个课程 计科22级12班这个作业要求在哪里 作业要求链接这个作业的目标 遍历论文查重并封装成可执行文件,学习PSP和commit规范,学习测试和评估代码一、设计思路 文件结构:程序流程:实现逻辑:查找资料发现比较简单的实现是通过计算余弦向量来实现重复…

echart map图标切换多选,单选,默认选中

需求是echart默认地图选中之前的去过的城市,一开始多选,后面点击为单选const option = {tooltip: {trigger: item,formatter: {b}},series: [{type: map,roam : true,//是否开启缩放和平移zoom : 1,//当前视角缩放比例selectedMode: multiple, // 只允许单选// 设置为一张完整…

CH58x/CH59x/CH57x RF_PHY(2.4g)切换Channel发送接收

前言:在做某些应用的时候可能需要我们发送或者接收时切换对应的channel。 此次完成测试的平台在WCH的CH592F上完成的。 在工作发送过程中切换37、38、39三个信道进行轮询发送。具体需要使用最关键的函数是:RF_SetChannel 实现代码如下:if(events & channl_37_tx_evt){RF…

ArmSoM-Sige5 的 RK3576 SoC 主线内核支持进展

我们很高兴地宣布,基于 RK3576 SoC 的 ArmSoM-Sige5 开发板的主线内核支持,collabora正在稳步推进中。RK3576 SoC 是 Rockchip 家族的一员,其设计和功能与广受欢迎的 RK3588 相似,许多硬件模块都得到了复用,这为我们在主线内核中添加支持提供了有利条件。 RK3576主线内核…

P3579

今天有点高效啊,切数论题都这样喵? #include<bits/stdc++.h> using namespace std; int main() {int n,a,b,c,d,s,m;cin>>n;while(n--){cin>>a>>b>>c>>d; m=min(b,d);for(int i=1;i<=m;i++){i=min(b/(b/i),d/(d/i));//优化,只考虑b/…

机器学习作业

Ch3-K均值聚类算法 【9月4日】 学号:102102156 姓名:高涛 1. make_circles方法生成数据 1.1 源代码 from sklearn.cluster import KMeans from sklearn.datasets import make_circles, make_moons, make_blobs import matplotlib.pyplo…