50 Java正则表达式之Pattern和Matcher

news/2025/3/3 23:23:37/文章来源:https://www.cnblogs.com/you-ni/p/18749644

前言

之前简单分析了Java正则表达式的基础用法和部分规则:String.matches方法使用
今天来看一下常用来处理正则表达式的两个类:

  1. Pattern 包名:java.util.regex.Pattern;

Pattern 类用于表示一个正则表达式的编译版本。通过 Pattern.compile() 方法可以将一个正则表达式编译成一个 Pattern 对象。
Pattern 类提供了一系列静态方法用于编译和匹配正则表达式,例如 compile()、matches()、split() 等。
通过 Pattern 对象可以获取正则表达式的相关信息,例如正则表达式的字符串表示、标志位等。

  1. Matcher 包名:java.util.regex.Matcher;

Matcher 类用于对输入字符串进行匹配操作。它通过 Pattern.matcher() 方法创建,并用于对指定的输入字符串执行匹配操作。
Matcher 类提供了一系列方法用于执行匹配操作,例如 matches()、find()、group() 等。
通过 Matcher 对象可以获取匹配结果的相关信息,例如匹配的子字符串、匹配的位置等。


一、Pattern和Matcher的简单使用

package com.example.Pattern;import java.util.regex.Matcher;
import java.util.regex.Pattern;public class PatternTest {public static void main(String[] args) {String input = "Hello, my age is 25 and my friend's age is 30.";// 定义正则表达式String regex = "\\d+"; // 匹配一个或多个数字// 编译正则表达式为 Pattern 对象Pattern pattern = Pattern.compile(regex);// 创建 Matcher 对象,并使用正则表达式匹配输入字符串Matcher matcher = pattern.matcher(input);// 查找匹配的数字while (matcher.find()) {System.out.println("Found: " + matcher.group());}}	
}

result:

分析:\\d+是匹配1到n个数字,至于findgroup功能后面详解,看样子find方法匹配到就返回true,同时group方法返回捕获到的内容。带着这个简单的例子进入到两个类的详细分析。


二、Pattern详解

2.1 Pattern 常用方法

2.1.1 compile(String regex)

compile(String regex):
compile 方法是 Pattern 类的静态方法,用于将给定的正则表达式字符串编译成一个 Pattern 对象。
该方法接受一个字符串参数 regex,表示要编译的正则表达式。
编译成功后,将返回一个 Pattern 对象,可以用于后续的匹配操作。

示例: 上面已经有了,不重复了。

2.1.2 matches(String regex, CharSequence input)

matches(String regex, CharSequence input):
matches 方法是 Pattern 类的静态方法,用于尝试将给定的正则表达式与整个输入字符串进行匹配。
该方法接受一个字符串参数 regex,表示要匹配的正则表达式,以及一个 CharSequence 参数 input,表示要匹配的输入字符串。
如果整个输入字符串与正则表达式匹配成功,则返回 true;否则返回 false。

示例

public class PatternTest {public static void main(String[] args) {String input = "Hello, my age is 25 and my friend's age is 30.";// 定义正则表达式String regex = "\\d+"; // 匹配一个或多个数字System.out.println(Pattern.matches(regex, "2")); System.out.println(Pattern.matches(regex, "20")); System.out.println(Pattern.matches(regex, " ")); System.out.println(Pattern.matches(regex, "1 2 3 4 ")); System.out.println(Pattern.matches(regex, "abcd")); }	
}

result:

analysis:

字符串 “2” 符合正则表达式 “\d+”,它包含一个数字字符。
字符串 “20” 也符合正则表达式 “\d+”,它包含两个数字字符。
字符串 " " 不符合正则表达式 “\d+”,它不包含任何数字字符。
字符串 "1 2 3 4 " 不符合正则表达式 “\d+”,它包含空格和数字字符,不是一个连续的数字字符串。
字符串 “abcd” 不符合正则表达式 “\d+”,它不包含任何数字字符。

2.1.3 split(CharSequence input)

split(CharSequence input):
split 方法用于根据正则表达式将输入字符串分割成多个子字符串。
该方法接受一个 CharSequence 参数 input,表示要分割的输入字符串。
返回一个字符串数组,包含了根据正则表达式分割后的子字符串。

示例

public static void main(String[] args) {System.out.println("-------,测试--------");String text = "apple,banana,orange,pear";Pattern pattern = Pattern.compile(",");String[] result = pattern.split(text);for (String s : result) {System.out.println(s);}   System.out.println("-------\\d+测试--------");String text1 = "1234,banana,2234,pear";Pattern pattern1 = Pattern.compile("\\d+");String[] result1 = pattern1.split(text1);for (String s : result1) {System.out.println(s);} System.out.println("-------\\d测试--------");String text2 = "1234,banana,2234,pear";Pattern pattern2 = Pattern.compile("\\d");String[] result2 = pattern2.split(text2);for (String s : result2) {System.out.println(s);}  
}	

result:

analysis:

字符串 “,” 截取了“,”,所以只剩下数字和字母。
字符串 “\d+” 截取了连续的数字,所以只剩下“,”和字母。
字符串 “\d"截取了单个的数字,所有相比于”\d+"有了很多换行符。

2.1.4 pattern()

pattern():
pattern 方法用于返回当前 Pattern 对象所表示的正则表达式的字符串形式。
该方法不接受任何参数,直接返回当前 Pattern 对象的正则表达式字符串。

示例

public static void main(String[] args) {Pattern pattern = Pattern.compile(",");String result = pattern.pattern();System.out.println(result);Pattern pattern1 = Pattern.compile("\\d+");String result1 = pattern1.pattern();System.out.println(result1);Pattern pattern2 = Pattern.compile("\\d");String result2 = pattern2.pattern();System.out.println(result2);
}	

result:

analysis:

该方法不接受任何参数,直接返回当前 Pattern 对象的正则表达式字符串。

2.1.5 matcher(CharSequence input)

matcher(CharSequence input):
matcher 方法用于创建一个 Matcher 对象,用于对指定的输入字符串进行匹配操作。
该方法接受一个 CharSequence 参数 input,表示要匹配的输入字符串。
返回一个 Matcher 对象,可以用于后续的匹配操作。

示例

public static void main(String[] args) {Pattern pattern = Pattern.compile("\\d+"); // 使用 compile() 方法创建 Pattern 对象Matcher matcher = pattern.matcher("1234,banana,2234,pear"); // 使用 Pattern 对象创建 Matcher 对象System.out.println(pattern);System.out.println(matcher);
}	

result:

analysis:

Pattern.compile(“\d+”) 返回的是正则表达式 \d+ 的字符串表示形式。而 pattern.matcher(“1234,banana,2234,pear”) 返回的是 Matcher 对象的字符串表示形式,其中包含了正则表达式模式、匹配的区域和最后的匹配结果。


三、Matcher详解

3.1 Matcher 常用方法

3.1.1 matches()

matches():
matches 方法尝试将整个输入字符串与模式进行匹配。
如果整个输入字符串与模式匹配成功,则返回 true;否则返回 false。

示例

public static void main(String[] args) {Pattern pattern = Pattern.compile("\\d+"); // 使用 compile() 方法创建 Pattern 对象Matcher matcher = pattern.matcher("1234"); // 使用 Pattern 对象创建 Matcher 对象System.out.println(matcher.matches());matcher = pattern.matcher("1234d");System.out.println(matcher.matches());matcher = pattern.matcher("12.34");System.out.println(matcher.matches());
}	

result:

analysis:

matcher.matches() 会尝试对整个输入字符串进行匹配,如果整个输入字符串匹配成功,则返回 true,否则返回 false。
当输入字符串为 “1234” 时,由于整个字符串都是数字,匹配成功,因此输出为 true。
当输入字符串为 “1234d” 时,由于字符串中包含非数字字符 “d”,匹配失败,因此输出为 false。
当输入字符串为 “12.34” 时,由于字符串中包含小数点 “.”,匹配失败,因此输出为 false。

3.1.2 find()

绝大多数情况下:find()和group()方法是搭配起来使用的。

find():
find 方法在输入字符串中查找下一个匹配的子序列。
如果找到匹配的子序列,则返回 true;否则返回 false。

3.1.3 group()

group():
group 方法返回当前匹配的子序列。
如果在调用 matches、find 等方法后找到了匹配的子序列,可以使用 group 方法获取匹配的内容。

示例

public static void main(String[] args) {Pattern pattern = Pattern.compile("\\d+"); // 使用 compile() 方法创建 Pattern 对象Matcher matcher = pattern.matcher("1234,banana,2234,pear");while (matcher.find()) {System.out.println("匹配的子序列:" + matcher.group());}matcher = pattern.matcher("1234banana2234pear");while (matcher.find()) {System.out.println("匹配的子序列:" + matcher.group());}}

result:

analysis:

非常简单
find 方法在输入字符串中查找下一个匹配的子序列。
group 方法返回当前匹配的子序列。

3.1.4 start()

start():
start 方法返回当前匹配的子序列的起始索引。
如果在调用 matches、find 等方法后找到了匹配的子序列,可以使用 start 方法获取匹配子序列的起始索引。

3.1.5 end()

end():
end 方法返回当前匹配的子序列的结束索引。
如果在调用 matches、find 等方法后找到了匹配的子序列,可以使用 end 方法获取匹配子序列的结束索引。

示例

public static void main(String[] args) {Pattern pattern = Pattern.compile("\\d+"); // 使用 compile() 方法创建 Pattern 对象Matcher matcher = pattern.matcher("1234,banana,2234,pear,911");while (matcher.find()) {System.out.println("匹配的子序列:" + matcher.group());System.out.println("起始子序列:" + matcher.start());System.out.println("结束子序列:" + matcher.end());System.out.println();}	 	
}	

result:

analysis:

第一个匹配的子序列为 “1234”,起始位置是 0,结束位置是 4。
第二个匹配的子序列为 “2234”,起始位置是 12,结束位置是 16。
第三个匹配的子序列为 “911”,起始位置是 22,结束位置是 25。

3.1.6 reset(CharSequence input)

reset(CharSequence input):
reset 方法将 Matcher 对象的状态重置,使其可以重新在输入字符串中进行匹配。
在重复使用 Matcher 对象进行匹配时,可以使用 reset ()方法清除之前的匹配状态。

示例

public static void main(String[] args) {Pattern pattern = Pattern.compile("\\d+"); // 使用 compile() 方法创建 Pattern 对象Matcher matcher = pattern.matcher("1234,banana,2234");// 第一次匹配while (matcher.find()) {System.out.println("第一次匹配的子序列:" + matcher.group());System.out.println("第一次起始子序列:" + matcher.start());System.out.println("第一次结束子序列:" + matcher.end());System.out.println();}// 重置 Matcher 对象matcher.reset("456,orange,789");// 第二次匹配while (matcher.find()) {System.out.println("第二次匹配的子序列:" + matcher.group());System.out.println("第二次起始子序列:" + matcher.start());System.out.println("第二次结束子序列:" + matcher.end());System.out.println();}}	

result:

analysis:

第一次匹配之后,我们调用了 reset() 方法并提供了一个新的输入字符串,这样 Matcher 对象的匹配状态就被重置了,可以重新从新的输入字符串中查找匹配的子序列,并输出相应的信息。


总结

Pattern 类是正则表达式的编译表示形式。它通过 compile() 方法将正则表达式编译为一个 Pattern 对象,然后可以使用这个对象来创建 Matcher 对象。Pattern 类提供了一系列静态方法和实例方法,用于对正则表达式进行编译、匹配和其他操作。
Matcher 类是用于对输入字符串进行正则表达式匹配操作的对象。它通过 Pattern 对象的 matcher() 方法创建,并提供了一系列方法用于进行匹配、查找、替换等操作。Matcher 对象可以重复使用,也可以通过 reset() 方法重置其匹配状态。

文章引用自:https://blog.csdn.net/qq_45649553/article/details/135960576

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/893203.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Cursor项目重构实践

在2025年3月的这个清晨,当我通过Cursor生成的TodoList项目首次运行时,那个将所有逻辑堆积在app.js中的"面条式代码"令人如鲠在喉。这促使我开启了一场与AI协作的重构之旅,以下是完整的心得记录 一、原始架构的痛点分析 初始项目采用典型的单体组件架构,app.js承载…

JUnit 版本影响 Bean 找不到

JUnit 版本影响 Bean 找不到 在为实现类编写测试类时,在测试类中使用构造器注入 Bean 时,提示找不到 Bean,代码如下: @Service public class WeChatServiceImpl implements IWeChatService {@Overridepublic String getNumber(String detailCode) { return detailCode; } }…

RMQ学习笔记

RMQ学习笔记 前言:这个算法无论是从适配性还是长度来说都很有实力...💦 关于 RMQ RMQ 是英文 Range Maximum/Minimum Query 的缩写,表示区间最大(最小)值。 详细信息 求 \(l-r\) 区间内的最大/最小数. 区间构造本质是DP.设 \(f[i][j]\) 为 \(i\sim i+2^{j-1}\) 的区间最大…

生意的本质是什么?几个关键概念的理解

生意的本质一句话理解 生意的本质可以理解为通过满足他人需求来实现价值交换的过程。其核心是围绕价值创造和价值交换来展开。满足需求:提供解决需求的产品或服务。 价值交换:人们参与交易,价值交换过程。可以看成是价值创造与交换的过程。底层逻辑:供需关系 供需关系 生意…

STM32实战——DHT11温湿度获取并展示

本博客详细介绍了DHT11数字温湿度传感器的工作原理、通信协议及其与STM32的接线方式,并提供了完整的驱动代码与示例程序,帮助读者实现温湿度数据采集与显示,适用于嵌入式开发者学习和参考。介绍 DHT11数字温湿度传感器是一款含有已校准数字信号输出的温湿度复合传感器,包括…

Windows平台调试器原理与编写03.单步

调试器原理与编写03.单步-C/C++基础-断点社区-专业的老牌游戏安全技术交流社区 - BpSend.net 单步 TF - 置位(置1 复位就是置0) 单步步入 -- 遇到call便入单步步过 -- 遇到call不入区分一条指令是不是call指令: 通过反汇编引擎,反汇编出来是个 call 说明 就是 call指令 代码实现…

day14 服务管理篇的学习

day14 服务管理的学习 1.Linux的默认提供的服务 1. shhd 的命令 [root@linux-yzk ~]# netstat -tnlp | grep sshd tcp 0 0 0.0.0.0:22 0.0.0.0:* LISTEN 1137/sshd tcp 0 0 127.0.0.1:6010 0.0.0…

关于ADAC儿童安全座椅排名

ADAC官网地址 直接翻看排行榜, 注意, 分数越小,排名越靠前。 国内推荐使用 亚马逊中国这样的app或者网站进行购买,海外直邮。 避免在国内买到贴牌货, 国内, 懂得都懂, 5星批发部, 实际使用的和送检的不是同一种, AB货。当然不是所有的国内的商品都是AB货。ADAC不支持主…

六、MyBatis特殊的SQL:模糊查询、动态设置表名、校验名称唯一性

六、MyBatis特殊的SQL:模糊查询、动态设置表名、校验名称唯一性@目录六、MyBatis特殊的SQL6.1 模糊查询6.2 动态设置表名6.3 校验名称唯一性本人其他相关文章链接 六、MyBatis特殊的SQL 6.1 模糊查询方式1:select * from litemall_user where username like %${username}%(推…

AI生成代码测试,前端加后端

首先是话术, 让我们先理顺一下项目的逻辑,对于这样一个WEB管理系统界面,我们有多个思路,如功能模块化,或者前后端分离。 由于我们的MIS系统相对简单,我们可以将整个开发流程进行功能化细分。 首先,完成基础的环境配置。 需求描述: 请设计一个仓储管理系统原型系统,该系…

目前国内可用Docker镜像源汇总(截至2025年2月)

[目前国内可用Docker镜像源汇总(截至2025年2月) - CoderJia](https://www.coderjia.cn/archives/dba3f94c-a021-468a-8ac6-e840f85867ea) 在国内使用 Docker 的朋友们,可能都遇到过配置镜像源来加速镜像拉取的操作。然而,最近几个月发现许多曾经常用的国内镜像站(包括各种…