Java正则表达式之Pattern和Matcher

目录

  • 前言
  • 一、Pattern和Matcher的简单使用
  • 二、Pattern详解
    • 2.1 Pattern 常用方法
      • 2.1.1 compile(String regex)
      • 2.1.2 matches(String regex, CharSequence input)
      • 2.1.3 split(CharSequence input)
      • 2.1.4 pattern()
      • 2.1.5 matcher(CharSequence input)
  • 三、Matcher详解
    • 3.1 Matcher 常用方法
      • 3.1.1 matches()
      • 3.1.2 find()
      • 3.1.3 group()
      • 3.1.4 start()
      • 3.1.5 end()
      • 3.1.6 reset(CharSequence input)
  • 总结


前言

之前简单分析了Java正则表达式的基础用法和部分规则:String.matches方法使用
今天来看一下常用来处理正则表达式的两个类:

  1. Pattern  包名:java.util.regex.Pattern;

Pattern 类用于表示一个正则表达式的编译版本。通过 Pattern.compile() 方法可以将一个正则表达式编译成一个 Pattern 对象。
Pattern 类提供了一系列静态方法用于编译和匹配正则表达式,例如 compile()、matches()、split() 等。
通过 Pattern 对象可以获取正则表达式的相关信息,例如正则表达式的字符串表示、标志位等。

  1. Matcher  包名:java.util.regex.Matcher;

Matcher 类用于对输入字符串进行匹配操作。它通过 Pattern.matcher() 方法创建,并用于对指定的输入字符串执行匹配操作。
Matcher 类提供了一系列方法用于执行匹配操作,例如 matches()、find()、group() 等。
通过 Matcher 对象可以获取匹配结果的相关信息,例如匹配的子字符串、匹配的位置等。


一、Pattern和Matcher的简单使用

简单例子代码:

package com.example.Pattern;import java.util.regex.Matcher;
import java.util.regex.Pattern;public class PatternTest {public static void main(String[] args) {String input = "Hello, my age is 25 and my friend's age is 30.";// 定义正则表达式String regex = "\\d+"; // 匹配一个或多个数字// 编译正则表达式为 Pattern 对象Pattern pattern = Pattern.compile(regex);// 创建 Matcher 对象,并使用正则表达式匹配输入字符串Matcher matcher = pattern.matcher(input);// 查找匹配的数字while (matcher.find()) {System.out.println("Found: " + matcher.group());}}	
}

result:
在这里插入图片描述
分析:\\d+是匹配1到n个数字,至于findgroup功能后面详解,看样子find方法匹配到就返回true,同时group方法返回捕获到的内容。带着这个简单的例子进入到两个类的详细分析。


二、Pattern详解

2.1 Pattern 常用方法

2.1.1 compile(String regex)

compile(String regex):
compile 方法是 Pattern 类的静态方法,用于将给定的正则表达式字符串编译成一个 Pattern 对象。
该方法接受一个字符串参数 regex,表示要编译的正则表达式。
编译成功后,将返回一个 Pattern 对象,可以用于后续的匹配操作。

示例: 上面已经有了,不重复了。

2.1.2 matches(String regex, CharSequence input)

matches(String regex, CharSequence input):
matches 方法是 Pattern 类的静态方法,用于尝试将给定的正则表达式与整个输入字符串进行匹配。
该方法接受一个字符串参数 regex,表示要匹配的正则表达式,以及一个 CharSequence 参数 input,表示要匹配的输入字符串。
如果整个输入字符串与正则表达式匹配成功,则返回 true;否则返回 false。

示例

public class PatternTest {public static void main(String[] args) {String input = "Hello, my age is 25 and my friend's age is 30.";// 定义正则表达式String regex = "\\d+"; // 匹配一个或多个数字System.out.println(Pattern.matches(regex, "2")); System.out.println(Pattern.matches(regex, "20")); System.out.println(Pattern.matches(regex, " ")); System.out.println(Pattern.matches(regex, "1 2 3 4 ")); System.out.println(Pattern.matches(regex, "abcd")); }	
}

result:
在这里插入图片描述
analysis:

字符串 “2” 符合正则表达式 “\d+”,它包含一个数字字符。
字符串 “20” 也符合正则表达式 “\d+”,它包含两个数字字符。
字符串 " " 不符合正则表达式 “\d+”,它不包含任何数字字符。
字符串 "1 2 3 4 " 不符合正则表达式 “\d+”,它包含空格和数字字符,不是一个连续的数字字符串。
字符串 “abcd” 不符合正则表达式 “\d+”,它不包含任何数字字符。

2.1.3 split(CharSequence input)

split(CharSequence input):
split 方法用于根据正则表达式将输入字符串分割成多个子字符串。
该方法接受一个 CharSequence 参数 input,表示要分割的输入字符串。
返回一个字符串数组,包含了根据正则表达式分割后的子字符串。

示例

  public static void main(String[] args) {System.out.println("-------,测试--------");String text = "apple,banana,orange,pear";Pattern pattern = Pattern.compile(",");String[] result = pattern.split(text);for (String s : result) {System.out.println(s);}   System.out.println("-------\\d+测试--------");String text1 = "1234,banana,2234,pear";Pattern pattern1 = Pattern.compile("\\d+");String[] result1 = pattern1.split(text1);for (String s : result1) {System.out.println(s);} System.out.println("-------\\d测试--------");String text2 = "1234,banana,2234,pear";Pattern pattern2 = Pattern.compile("\\d");String[] result2 = pattern2.split(text2);for (String s : result2) {System.out.println(s);}  }	

result:
在这里插入图片描述

analysis:

字符串 “,” 截取了“,”,所以只剩下数字和字母。
字符串 “\d+” 截取了连续的数字,所以只剩下“,”和字母。
字符串 “\d"截取了单个的数字,所有相比于”\d+"有了很多换行符。

2.1.4 pattern()

pattern():
pattern 方法用于返回当前 Pattern 对象所表示的正则表达式的字符串形式。
该方法不接受任何参数,直接返回当前 Pattern 对象的正则表达式字符串。

示例

    public static void main(String[] args) {Pattern pattern = Pattern.compile(",");String result = pattern.pattern();System.out.println(result);Pattern pattern1 = Pattern.compile("\\d+");String result1 = pattern1.pattern();System.out.println(result1);Pattern pattern2 = Pattern.compile("\\d");String result2 = pattern2.pattern();System.out.println(result2);}	

result:
在这里插入图片描述
analysis:

该方法不接受任何参数,直接返回当前 Pattern 对象的正则表达式字符串。

2.1.5 matcher(CharSequence input)

matcher(CharSequence input):
matcher 方法用于创建一个 Matcher 对象,用于对指定的输入字符串进行匹配操作。
该方法接受一个 CharSequence 参数 input,表示要匹配的输入字符串。
返回一个 Matcher 对象,可以用于后续的匹配操作。

示例

    public static void main(String[] args) {Pattern pattern = Pattern.compile("\\d+"); // 使用 compile() 方法创建 Pattern 对象Matcher matcher = pattern.matcher("1234,banana,2234,pear"); // 使用 Pattern 对象创建 Matcher 对象System.out.println(pattern);System.out.println(matcher);}	

result:
在这里插入图片描述

analysis:

Pattern.compile(“\d+”) 返回的是正则表达式 \d+ 的字符串表示形式。而 pattern.matcher(“1234,banana,2234,pear”) 返回的是 Matcher 对象的字符串表示形式,其中包含了正则表达式模式、匹配的区域和最后的匹配结果。


三、Matcher详解

3.1 Matcher 常用方法

3.1.1 matches()

matches():
matches 方法尝试将整个输入字符串与模式进行匹配。
如果整个输入字符串与模式匹配成功,则返回 true;否则返回 false。

示例

    public static void main(String[] args) {Pattern pattern = Pattern.compile("\\d+"); // 使用 compile() 方法创建 Pattern 对象Matcher matcher = pattern.matcher("1234"); // 使用 Pattern 对象创建 Matcher 对象System.out.println(matcher.matches());matcher = pattern.matcher("1234d");System.out.println(matcher.matches());matcher = pattern.matcher("12.34");System.out.println(matcher.matches());}	

result:
在这里插入图片描述

analysis:

matcher.matches() 会尝试对整个输入字符串进行匹配,如果整个输入字符串匹配成功,则返回 true,否则返回 false。
当输入字符串为 “1234” 时,由于整个字符串都是数字,匹配成功,因此输出为 true。
当输入字符串为 “1234d” 时,由于字符串中包含非数字字符 “d”,匹配失败,因此输出为 false。
当输入字符串为 “12.34” 时,由于字符串中包含小数点 “.”,匹配失败,因此输出为 false。

3.1.2 find()

绝大多数情况下:find()和group()方法是搭配起来使用的。

find():
find 方法在输入字符串中查找下一个匹配的子序列。
如果找到匹配的子序列,则返回 true;否则返回 false。

3.1.3 group()

group():
group 方法返回当前匹配的子序列。
如果在调用 matches、find 等方法后找到了匹配的子序列,可以使用 group 方法获取匹配的内容。

示例

    public static void main(String[] args) {Pattern pattern = Pattern.compile("\\d+"); // 使用 compile() 方法创建 Pattern 对象Matcher matcher = pattern.matcher("1234,banana,2234,pear");while (matcher.find()) {System.out.println("匹配的子序列:" + matcher.group());}matcher = pattern.matcher("1234banana2234pear");while (matcher.find()) {System.out.println("匹配的子序列:" + matcher.group());}}

result:
在这里插入图片描述

analysis:

非常简单
find 方法在输入字符串中查找下一个匹配的子序列。
group 方法返回当前匹配的子序列。

3.1.4 start()

start():
start 方法返回当前匹配的子序列的起始索引。
如果在调用 matches、find 等方法后找到了匹配的子序列,可以使用 start 方法获取匹配子序列的起始索引。

3.1.5 end()

end():
end 方法返回当前匹配的子序列的结束索引。
如果在调用 matches、find 等方法后找到了匹配的子序列,可以使用 end 方法获取匹配子序列的结束索引。

示例

    public static void main(String[] args) {Pattern pattern = Pattern.compile("\\d+"); // 使用 compile() 方法创建 Pattern 对象Matcher matcher = pattern.matcher("1234,banana,2234,pear,911");while (matcher.find()) {System.out.println("匹配的子序列:" + matcher.group());System.out.println("起始子序列:" + matcher.start());System.out.println("结束子序列:" + matcher.end());System.out.println();}	 	}	

result:
在这里插入图片描述

analysis:

第一个匹配的子序列为 “1234”,起始位置是 0,结束位置是 4。
第二个匹配的子序列为 “2234”,起始位置是 12,结束位置是 16。
第三个匹配的子序列为 “911”,起始位置是 22,结束位置是 25。

3.1.6 reset(CharSequence input)

reset(CharSequence input):
reset 方法将 Matcher 对象的状态重置,使其可以重新在输入字符串中进行匹配。
在重复使用 Matcher 对象进行匹配时,可以使用 reset ()方法清除之前的匹配状态。

示例

 public static void main(String[] args) {Pattern pattern = Pattern.compile("\\d+"); // 使用 compile() 方法创建 Pattern 对象Matcher matcher = pattern.matcher("1234,banana,2234");// 第一次匹配while (matcher.find()) {System.out.println("第一次匹配的子序列:" + matcher.group());System.out.println("第一次起始子序列:" + matcher.start());System.out.println("第一次结束子序列:" + matcher.end());System.out.println();}// 重置 Matcher 对象matcher.reset("456,orange,789");// 第二次匹配while (matcher.find()) {System.out.println("第二次匹配的子序列:" + matcher.group());System.out.println("第二次起始子序列:" + matcher.start());System.out.println("第二次结束子序列:" + matcher.end());System.out.println();}}	

result:
在这里插入图片描述

analysis:

第一次匹配之后,我们调用了 reset() 方法并提供了一个新的输入字符串,这样 Matcher 对象的匹配状态就被重置了,可以重新从新的输入字符串中查找匹配的子序列,并输出相应的信息。


总结

Pattern 类是正则表达式的编译表示形式。它通过 compile() 方法将正则表达式编译为一个 Pattern 对象,然后可以使用这个对象来创建 Matcher 对象。Pattern 类提供了一系列静态方法和实例方法,用于对正则表达式进行编译、匹配和其他操作。
Matcher 类是用于对输入字符串进行正则表达式匹配操作的对象。它通过 Pattern 对象的 matcher() 方法创建,并提供了一系列方法用于进行匹配、查找、替换等操作。Matcher 对象可以重复使用,也可以通过 reset() 方法重置其匹配状态。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/449159.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

wangEditor v4的简单使用

当前文档是 wangEditor v4 版本的。 wangEditor v5 已经正式发布,可参考文档。 v5 发布之后,v4 将不再开发新功能。 介绍 English documentation wangEditor4 —— 轻量级 web 富文本编辑器,配置方便,使用简单。 官网&#…

[python]基于LSTR车道线实时检测onnx部署

【框架地址】 https://github.com/liuruijin17/LSTR 【LSTR算法介绍】 LSTR车道线检测算法是一种用于识别和定位车道线的计算机视觉算法。它基于图像处理和机器学习的技术,通过对道路图像进行分析和处理,提取出车道线的位置和方向等信息。 LSTR车道线…

「效果图渲染」效果图与3D影视动画渲染平台

效果图渲染和3D影视动画渲染都是视觉图像渲染的领域应用。效果图渲染主要服务于建筑、室内设计和产品设计等行业,这些领域通常对视觉呈现的精度和细节有较高要求。与之相比,3D影视动画渲染则普遍应用于电影、电视、视频游戏和广告等媒体领域,…

项目安全-----加密算法实现

目录 对称加密算法 AES (ECB模式) AES(CBC 模式)。 非对称加密 对称加密算法 对称加密算法,是使用相同的密钥进行加密和解密。使用对称加密算法来加密双方的通信的话,双方需要先约定一个密钥,加密方才能加密&#…

无人机激光雷达标定板

机载激光雷达标定板是用于校准和验证机载激光雷达系统的设备。由于机载激光雷达系统在测量地形、建筑物和植被等方面具有广泛的应用,因此标定板的使用对于确保测量结果的准确性和可靠性至关重要。 标定板通常由高反射率的材料制成,如镀金的玻璃或陶瓷&am…

flv视频格式批量截取封面图(不占内存版)--其他视频格式也通用

flv视频格式批量截取封面图(不占内存版)--其他视频格式也通用 需求(实现的效果)功能实现htmlcssjs 需求(实现的效果) 批量显示视频,后端若返回有imgUrl,则直接显示图1, 若无&#xf…

【推荐】运放作为跟随器时,负反馈上加电阻的作用?

请问何种信号源或者输出是什么状况下跟随器需要使用电阻呢?使用多大阻值? 答:信号源内阻较大时,添加阻值与信号源内阻相同的反馈电阻,可以减少输出失调电压,提高精度。 R2的作用是为了防止输出意外接地&am…

AspNet web api 和mvc 过滤器差异

最近在维护老项目。定义个拦截器记录接口日志。但是发现不生效 最后发现因为继承的 ApiController不是Controller 只能用 System.Web.Http下的拦截器生效。所以现在总结归纳一下 Web Api: System.Web.Http.Filters.ActionFilterAttribute 继承该类 Mvc: System.Web.Mvc.Ac…

版本管理git及其命令介绍-附带详细操作

前言 在版本管理时代之前,人们写软件的方式如下图1所示 图1 无版本管理的代码 其坏处就是软件版本随着时间越来越多,每个版本修改了什么内容,修改了哪些文件,如果没有详细记录也不知道。这样久会导致如果我们想回退到某个版本内…

4通过干扰 Char 设备为 PRNG 添加后门_Linux_Rootkit.md

Xcellerator 密码学Linux其他逆向工程 文章目录 [Linux Rootkit 第 4 部分:通过干扰 Char 设备为 PRNG 添加后门](https://xcellerator.github.io/posts/linux_rootkits_04/)Linux 中的字符设备字符设备的读取例程编写 Rootkit我们能去哪里呢? Linux Ro…

js中的数据类型(存储上的差别)

文章目录 前言一、基本类型NumberUndefinedStringNullBooleanSymbol 二、引用类型ObjectArrayFunction其他引用类型 三、存储区别基本类型引用类型 小结 前言 在JavaScript中,我们可以分成两种类型: 基本类型复杂类型 两种类型的区别是:存…

编译Duilib库

编译Duilib,遇到几个错误; 最终生成的lib如下; 报一个错误,无法打开源文件"StdAfx.h", 查了一下资料,反正我的在下图 C/C - 常规 - 附加包含目录,填入下图内容就可以了,这…