正则表达式 Regular Expression学习

 该文章内容为以下视频的学习笔记:

10分钟快速掌握正则表达式_哔哩哔哩_bilibili正则表达式在线测试工具:https://regex101.com/, 视频播放量 441829、弹幕量 1076、点赞数 19330、投硬币枚数 13662、收藏人数 26242、转发人数 2768, 视频作者 奇乐编程学院, 作者简介 ,相关视频:正则表达式30分钟入门40分钟进阶(绝对能学会),【无废话30分钟】Lua快速入门教程 - 4K超清,正则表达式15分钟速成,2022最新 彻底搞懂正则表达式,20分钟学完一遍python基础,一个10分钟的numpy入门教程,15分钟带你快速掌握正则表达式,硬核Python进阶篇 - 一小时掌握正则表达式 【正则表达式,re,Python,正则表达式实例】,Docker 是什么?30秒听懂。,Python小技巧:装饰器(Decorator)icon-default.png?t=N7T8https://www.bilibili.com/video/BV1da4y1p7iZ/?spm_id_from=333.1007.top_right_bar_window_history.content.click&vd_source=4298755c4e2edc1fe805c41cc2d7379a

1.简介:

正则表达式:匹配指定规则的字符串。

应用:

1️⃣编译器中的词法分析器 使用正则表达式去匹配代码中的关键字

2️⃣网站上的注册表单会用到正则表达式去判断密码的复杂程度

3️⃣爬虫中用正则表达式中提取我们需要的信息


2.限定符(一个字符):

(1)?

作用:? 在正则表达式中是一个特殊的字符——限定符,代表前面这个字符需要出现 0 次或者 1 次

 

(2)*

 作用:去匹配 0 个或[多] 个字符(代表没有或者可以出现多次)

(3)+ 

 作用:匹配 出现[1] 次以上的字符

(4){···}

 作用:花括号同时允许我们输入一个范围,精确到匹配次数


3.匹配多个字符的重复

匹配中间多次出现的ab


4.OR Operator “或” 运算


5.Character Classes 字符类

匹配由 abc 这几个字母构成的单词

作用:方括号里的内交代表要求匹配的字符只能取自于它们

此外可以在方括号里指定字符的范围

例:

  • [a-z]代表所有的小写英文字符
  • [a-zA-Z]代表所有的英文字符
  • [a-zA-Z0-9] 代表所有的英文字符和数字

 若在方括号前加  脱字符 ^,则代表要求匹配除了尖号后面列出的 [以外] 的字符


6.Mera-characters  元字符

正则表达式中的大多数元字符都以反斜杠开头 

例:

(1)\d  代表数字字符   等同于 [0-9]

 (2)\w  单词字符(英文、数字及下划线)

(3)\s 空白符(包含Tab和换行符)

 (4)\D 非数字字符

(5)\W 非单词字符

(6)\S 非空白字符

 (7). 字符

 作用:代表任意字符,但不代表换行符

(8)^ 匹配行首  $ 配行尾 

正则表达式中的脱字符(^)有两种不同的用法:

  1. 字符类([])内部:当脱字符(^)作为字符类的第一个字符时,表示取反操作,即匹配除了指定字符以外的任意字符。例如,正则表达式[^aeiou]匹配任意非元音字母。
  2. 模式开头:当脱字符(^)作为正则表达式的开头时,表示匹配字符串的开始位置。例如,正则表达式^abc匹配以"abc"开头的字符串。

7.实操:

(1)匹配里面里面的 HTML标签

错误: 

原因:.+ 会匹配尽可能多的字符 ——>. 代表任意字符

正确方式:

? 会将正则表达式中默认的贪婪匹配(Greedy Match)切换为懒惰匹配(Lazy Match)

 


(2)RGB 颜色值匹配 

匹配文本中出现的所有十六进制 RGB 颜色值

在表达式末尾加入\b 来代表单词字符的边界 

(3)IPv4 地址匹配

 IPv4 的地址实际上是由四段数字构成,数字之间由句点隔开

\d+ 会匹配任何长度大于 1 的数字

\. 代表 . 这个字面量(. 是元字符 代表任意字符)

但 IP 地址的每个部分都是 8 位的数字,也就是说它的范围介于 0-255 之间。

正确方式:

  1. 如果它的前两位是25,那么最后一位只能取 0-5 之间的数字
  2. 如果它的第一位是 2,第二位是 0-4 之间的数,那么最后一位可以取 0-9 之间的任意值(用 \d 代替)
  3. 如果它的第一位是 0 或者 1,那么最后两位可以取 00-99 之间的任意数字(用 \d \ d 代替)

IP 地址的每一部分也可以由两位数字构成,甚至是1位。——> 可以直接将这里的第一个数字和第三个数字后面都加一个 ?

 

📜8.总结:

 学习资源:

正则表达式30分钟入门教程 作者:deerchao
https://deerchao.cn/tutorials/regex/regex.htm

Regex tutorial ——A quick cheatsheet by examples(英文)作者:Jonny Fox
https://medium.com/factory-mind/regex-tutorial-a-simple-cheatsheet-by-examples-649dc1c3f285

Regular Expressions Tutorial(英文)
https://www.regular-expressions.info/tutorial.html

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/124090.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Spring MVC 十:异常处理

异常是每一个应用必须要处理的问题。 Spring MVC项目,如果不做任何的异常处理的话,发生异常后,异常堆栈信息会直接抛出到页面。 比如,我们在Controller写一个异常: GetMapping(value"/hello",produces{&qu…

【数据结构与算法】- 数组

数组 1.1 数组的定义1.2 数组的创建1.3 数组在内存中的情况2.1 初始化数组2.2 插入元素2.3 删除元素2.4 读取元素2.5 遍历数组 1.1 数组的定义 数组中的是在内存中是连续存储的,内存是由一个个内存单元组成的,每一个内存单元都有自己的地址,…

优先级队列

优先级队列 一端进,另一端出 按优先级出队 普通队列 一端进,另一端出 FIFO 我们做个约定:数字大的,优先级越高 ,优先出队 无序数组实现 要点 入队保持顺序 出队前找到优先级最高的出队,相当于一次选择排序…

Tensorflow2 GPU 安装方法

一、Tensorflow2 GPU 安装方法 1. 首先安装Anaconda3环境2. 在Anaconda Prompt 中安装tensorflow23. 验证GPU是否可以使用4. 错误解决 1. 首先安装Anaconda3环境 https://www.anaconda.com/ 2. 在Anaconda Prompt 中安装tensorflow2 conda update conda conda create -n ten…

Unity把UGUI再World模式下显示到相机最前方

Unity把UGUI再World模式下显示到相机最前方 通过脚本修改Shader 再VR里有时候要把3D的UI显示到相机最前方,加个UI相机会坏事,可以通过修改unity_GUIZTestMode来解决。 测试用例 测试用例如下: 场景包含一个红色的盒子,一个UI…

github搜索技巧

指定语言 language:java 比如我要找用java写的含有blog的内容 搜索项目名称包含关键词的内容 vue in:name 其他如项目描述跟项目文档,如下 组合使用 vue in:name,description,readme 根据Star 或者fork的数量来查找 总结 springboot vue stars:>1000 p…

关于字符拼接

当然,以下是加入了幽默注释的代码和对应的逻辑树: # 提示用户输入input和txt内容,期待用户真有输入 input_text input("请输入input文本:") # 好了,快点输入吧 txt_text input("请输入txt文本&#…

【数据结构】红黑树(C++实现)

​ ​📝个人主页:Sherry的成长之路 🏠学习社区:Sherry的成长之路(个人社区) 📖专栏链接:数据结构 🎯长路漫漫浩浩,万事皆有期待 上一篇博客:【数据…

Android逆向学习(五)app进行动态调试

Android逆向学习(五)app进行动态调试 一、写在前面 非常抱歉鸽了那么久,前一段时间一直在忙,现在终于结束了,可以继续更新android逆向系列的,这个系列我会尽力做下去,然后如果可以的话我看看能…

华为云HECS云服务器docker环境下安装nginx

前提:有一台华为云服务器。 华为云HECS云服务器,安装docker环境,查看如下文章。 华为云HECS安装docker-CSDN博客 一、拉取镜像 下载最新版Nginx镜像 (其实此命令就等同于 : docker pull nginx:latest ) docker pull nginx查看镜像 dock…

SpringBoot中使用Servlet和Filter

为什么要把Servlet和Filter写在一起,因为使用方式很相似 两种方式 第一种,使用Servlet和Filter 使用Servlet 继承HttpServlet 注册Servlet 使用Filter 1.自定义过滤器 2.注册过滤器 这里注意一点 使用/**无效 至少我这2.4.5版本是这样 过滤所有请求用/* 那么其实还有…

(unordered)map和set封装(底层红黑树)

map和set封装 文章目录 map和set封装设计问题(知其所以然)为什么要对iterator进行封装?为什么要引入Self Ref Ptr这些模板参数?为什么是试图从non_const转变为const,而不是const转为non_const如何解决 为什么说能加con…