java正则表达式教程

什么是正则表达式:

正则表达式是一种用来描述字符串模式的语法。在 Java 中,正则表达式通常是一个字符串,它由普通字符(例如字母、数字、标点符号等)和特殊字符(称为元字符)组成。这些特殊字符可以表示一些模式,例如匹配数字、字母、空格等。

正则表达式的作用:

正则表达式在 Java 中被广泛应用于字符串处理中,主要用于以下几个方面:

  1. 查找匹配的文本:可以使用正则表达式在文本中查找特定的模式或子字符串。

  2. 验证输入的格式:可以使用正则表达式验证输入字符串是否符合特定的格式,例如电子邮件地址、手机号码等。

  3. 替换匹配的文本:可以使用正则表达式替换文本中匹配的部分为指定的字符串。

  4. 分割字符串:可以使用正则表达式将字符串分割成多个部分,例如根据逗号、空格等字符进行分割。

 正则表达式的优缺点:

优点:
  1. 灵活性:正则表达式提供了一种灵活的方式来描述字符串模式,可以精确地匹配各种复杂的模式,从而实现灵活的文本处理和匹配需求。

  2. 强大的模式匹配能力:正则表达式支持各种模式匹配操作,包括查找、替换、验证等,可以满足各种文本处理需求。

  3. 广泛应用:正则表达式在各种编程语言和平台上都得到广泛支持和应用,是一种通用的文本处理工具。

  4. 表达能力强:正则表达式可以使用各种元字符和特殊语法来表达复杂的字符串模式,具有很强的表达能力。

缺点:
  1. 复杂性:正则表达式的语法相对复杂,学习曲线较陡,对于初学者来说可能需要一些时间和练习才能掌握。

  2. 可读性差:由于正则表达式的语法较为紧凑和晦涩,编写和阅读正则表达式可能比较困难,尤其是对于复杂的正则表达式。

  3. 性能:对于复杂的正则表达式模式和大量的文本数据,正则表达式的性能可能不如手动编写的字符串处理代码,可能会导致性能问题。

  4. 维护困难:一些复杂的正则表达式可能会变得难以理解和维护,特别是当需要修改或扩展现有的正则表达式时。

组件:

1. 基本匹配
  • 字面字符:直接匹配字符串中的特定字符。例如,cat 会匹配 "cat"。
  • 元字符:拥有特殊意义的字符,用于构建强大的匹配模式,如 .^$*+?|()[]{} 等。

 

正则表达式是一种强大的文本处理工具,用于搜索、匹配和操作字符串。它们基于一套规则来识别字符串中的特定模式。正则表达式广泛应用于编程、数据分析、文本处理等领域。以下是正则表达式的一些基本概念和组件:

2. 特殊字符类
  • .:匹配除换行符外的任意单个字符。
  • \d\w\s:分别匹配任意数字、任意字母或数字(包括下划线),以及任意空白字符(如空格、制表符)。
  • \D\W\S:匹配任意非数字、非单词字符、非空白字符。
3. 字符集
  • [abc]:匹配任何一个列在方括号中的字符(如 'a'、'b' 或 'c')。
  • [^abc]:匹配任何不在方括号中的字符。
4. 边界匹配
  • ^:匹配行的开头。
  • $:匹配行的结尾。
  • \b:匹配单词边界,即单词和空格之间的位置。
  • \B:匹配非单词边界的位置。
5. 量词
  • *:匹配前面的元素零次或多次。
  • +:匹配前面的元素一次或多次。
  • ?:匹配前面的元素零次或一次。
  • {n}:匹配前面的元素恰好 n 次。
  • {n,}:匹配前面的元素至少 n 次。
  • {n,m}:匹配前面的元素至少 n 次,但不超过 m 次。
6. 分组和捕获
  • (xyz):将 'xyz' 视为一个单一的单位,并捕获这部分匹配的文本。这些捕获可以用于后续的操作和引用。
7. 或运算
  • |:匹配两个或多个分支选择,例如 cat|dog 表示匹配 "cat" 或 "dog"。
8. 转义字符
  • \:用于转义特殊字符,使其被解释为字面值,如 \. 就是匹配点号本身,而不是任意字符的元字符。

 

Pattern 类和 Matcher 类:

Java 中的正则表达式通常使用 java.util.regex 包中的类来进行处理,主要包括 Pattern 类和 Matcher 类。Pattern 类表示编译后的正则表达式模式,而 Matcher 类用于执行匹配操作。

Pattern 类

Pattern 类用于表示编译后的正则表达式模式。它提供了一系列静态方法来编译和获取正则表达式模式。主要方法包括:

  1. compile(String regex):

    • 静态方法,用于将给定的正则表达式字符串编译为 Pattern 对象。
    • 返回一个 Pattern 对象,表示编译后的正则表达式模式。
  2. matcher(CharSequence input):

    • 方法用于创建一个 Matcher 对象,用于在给定的输入字符序列中执行匹配操作。
    • 接受一个 CharSequence 参数,可以是 StringStringBuilder 等字符序列。
  3. split(CharSequence input):

    • 方法用于根据正则表达式模式将输入字符序列分割成多个部分。
    • 返回一个 String[] 数组,包含分割后的子字符串。
Matcher 类

Matcher 类是用于执行匹配操作的对象。它提供了一系列方法来执行查找、替换等操作。主要方法包括:

  1. matches():

    • 方法用于尝试将整个输入字符序列与正则表达式模式进行匹配。
    • 返回一个布尔值,表示是否整个输入字符序列与模式匹配。
  2. find():

    • 方法用于在输入字符序列中查找下一个匹配项。
    • 返回 true 表示找到了匹配项,否则返回 false
  3. start() 和 end():

    • start() 方法返回当前匹配的子字符串在原始输入字符序列中的起始位置(包含)。
    • end() 方法返回当前匹配的子字符串在原始输入字符序列中的结束位置(不包含)。
  4. group():

    • 方法用于返回当前匹配的子字符串。
    • 如果在调用 find() 方法之后调用 group() 方法,则返回当前匹配的子字符串。
    • 如果在调用 matches() 方法之后调用 group() 方法,则返回整个输入字符序列。

代码实例: 

1. 验证邮箱地址是否有效
import java.util.regex.*;public class Main {public static void main(String[] args) {String email = "example@example.com";String regex = "^[a-zA-Z0-9_+&*-]+(?:\\.[a-zA-Z0-9_+&*-]+)*@(?:[a-zA-Z0-9-]+\\.)+[a-zA-Z]{2,7}$";boolean isValid = email.matches(regex);if (isValid) {System.out.println("Valid email address");} else {System.out.println("Invalid email address");}}
}
2. 提取文本中的所有链接
import java.util.regex.*;
import java.util.*;public class Main {public static void main(String[] args) {String text = "Visit my website at https://example.com and my blog at http://blog.example.com";String regex = "https?://\\S+";Pattern pattern = Pattern.compile(regex);Matcher matcher = pattern.matcher(text);List<String> links = new ArrayList<>();while (matcher.find()) {links.add(matcher.group());}System.out.println("Links found:");for (String link : links) {System.out.println(link);}}
}
3. 替换字符串中的所有数字
public class Main {public static void main(String[] args) {String text = "Today is 2024-04-16";String replacedText = text.replaceAll("\\d", "*");System.out.println(replacedText); // 输出:Today is ****-**-**}
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/625251.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

NLP基础—jieba分词

jieba分词 支持四种分词模式 精确模式 试图将句子最精确地切开,适合文本分析;全模式 把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义;搜索引擎模式 在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。paddle模式 利用Paddle…

WARNING: No swap limit support——查看docker状态时提示警告

环境&#xff1a;Ubuntu 20.04 1、警告详情 执行命令 service docker status如下图 2、解决办法 2.1 修改文件 执行命令 vim /etc/default/grub在GRUB_CMDLINE_LINUX中追加cgroup_enablememory swapaccount1&#xff0c;如下&#xff1a; # If you change this file…

elmentui树形表格使用Sortable拖拽展开行时拖拽bug

1、使用elemntui的el-table使用Sortable进行拖拽&#xff0c;如下 const el this.$el.querySelector(.el-table__body-wrapper tbody) Sortable.create(el, {onEnd: (event) > {const { oldIndex, newIndex } event//拿到更新前后的下标即可完成数据的更新} })2、但是我这…

分析ARP解析过程

1、实验环境 主机A和主机B连接到交换机&#xff0c;并与一台路由器互连&#xff0c;如图7.17所示&#xff0c;路由器充当网关。 图7.17 实验案例一示意图 2、需求描述 查看 ARP 相关信息,熟悉在PC 和 Cisco 设备上的常用命令,设置主机A和主机B为同一个网段网关设置为路由接…

2024-14.python前端+Django

第四篇 web前端 第1章 、Web的基本概念 前端基础总共分为三部分&#xff1a;html、css和js。 1.3、HTTP协议 1.3.1 、http协议简介 HTTP协议是Hyper Text Transfer Protocol&#xff08;超文本传输协议&#xff09;的缩写,是用于万维网&#xff08;WWW:World Wide Web &am…

故障转移-redis

4.4.故障转移 集群初识状态是这样的&#xff1a; 其中7001、7002、7003都是master&#xff0c;我们计划让7002宕机。 4.4.1.自动故障转移 当集群中有一个master宕机会发生什么呢&#xff1f; 直接停止一个redis实例&#xff0c;例如7002&#xff1a; redis-cli -p 7002 sh…

LVM和磁盘配额

目录 1、LVM &#xff08;1&#xff09;LVM机制 &#xff08;2&#xff09;LVM的管理命令 &#xff08;3&#xff09;创建并使用LVM &#xff08;4&#xff09;扩容 2、磁盘配额 &#xff08;1&#xff09;什么叫磁盘配额 &#xff08;2&#xff09;磁盘配额的条件和特点…

OpenHarmony、HarmonyOS和Harmony NEXT 《我们不一样》

1. OpenHarmony 定义与地位&#xff1a;OpenHarmony是鸿蒙系统的底层内核系统&#xff0c;集成了Linux内核和LiteOS&#xff0c;为各种设备提供统一的操作系统解决方案。 开源与商用&#xff1a;OpenHarmony是一个开源项目&#xff0c;允许开发者自由访问和使用其源代码&#…

零代码编程:用kimichat将mp4视频批量转为mp3音频

一个文件夹里面有多个子文件夹&#xff0c;里面的视频需要转成为mp3音频格式。可以在kimichat中键入提示词&#xff1a; 你是一个Python编程专家&#xff0c;要完成一个Python脚本的编写任务&#xff0c;具体步骤如下&#xff1a; 打开文件夹&#xff1a;D:\CHATGPT For TikT…

HarmonyOS4-数据持久化

轻量级preferences&#xff1a; 关系型数据库&#xff1a; 增删改&#xff1a; 查询语句&#xff1a; 具体详情代码可参与源码&#xff1a; 黑马大佬写的。 harmonyos-lessons: 黑马程序员B站HarmonyOS课程的基础篇代码部分

项目中,如何写 readme.md 文件 | 写项目总结

tips&#xff1a;注意写 1. readme文件&#xff1a;①项目文档&#xff08;项目需求和设计文档、项目系统架构和技术文档、接口文档&#xff09;、②项目结构、③启动项目。具体结构见下文。 2. 项目总结&#xff1a;技术栈、描述、主要工作&#xff01;&#xff01;需求及功…

【React】Ant Design自定义主题风格及主题切换

Ant Design 的自定义主题&#xff0c;对于刚入手的时候感觉真是一脸蒙圈&#xff0c;那今天给它梳理倒腾下&#xff1b; 1、自定义主题要点 整体样式变化&#xff0c;主要两个部分&#xff1a; 1.1、Design Token https://ant.design/docs/react/customize-theme-cn#theme 官…