python基础5——正则、数据库操作

文章目录

  • 一、数据库编程
    • 1.1 connect()函数
    • 1.2 命令参数
    • 1.3 常用语句
  • 二、正则表达式
    • 2.1 匹配方式
    • 2.2 字符匹配
    • 2.3 数量匹配
    • 2.4 边界匹配
    • 2.5 分组匹配
    • 2.6 贪婪模式&非贪婪模式
    • 2.7 标志位

一、数据库编程

  • 可以使用python脚本对数据库进行操作,比如获取数据库数据保存到文件中,这个功能可以通过数据库相关模块进行实现。
  • 在python2.x版本中使用的是MySQLdb模块,python3.x版本中使用的是pymysql模块,两者用法几乎相同。
  • pymysql是第三方模块,需要单独安装,首选通过pip安装PyMySQL。
  • 对不同类型的数据库操作,需要安装导入的模块也不同。

1.1 connect()函数

  • connect()函数:用来建立和数据库的连接。
connect()函数常用参数描述
host数据库主机地址
user数据库账户
passwd账户密码
db使用的数据库
port数据库主机端口,默认3306
connect_timeout连接超时时间,默认10,单位秒
charset使用的字符集
cursorclass自定义游标使用的类。上面示例用的是字典类,以字典形式返回结果,默认是元组形式。

1.安装pymysql模块。

pip3 install pymysql

2.准备好数据库信息。

##安装数据库实例。
docker run -d --name qingjun -p 3306:3306 -e MYSQL_ROOT_PASSWORD=123456 mysql:5.7.30##创建数据库和表,用来测试。
create database test;
use test;
create table user(id int primary key not null auto_increment,username varchar(50) not null,password varchar(50) not null);

在这里插入图片描述
3.连接数据库,开始操作数据库。

在这里插入图片描述

import pymysql##数据库信息。
conn = pymysql.connect(host='192.168.161.132',port=3306,user='root',password='123456',db='test',charset='utf8',cursorclass=pymysql.cursors.DictCursor)
cursor = conn.cursor()    ##建立数据库连接。# 创建一条记录.
sql = "insert into user(username, password) values('qingjun', '123456')"
cursor.execute(sql)    ##执行sql语句。
conn.commit()          ##写入到数据库。

4.查看数据库数据。
在这里插入图片描述

1.2 命令参数

连接对象常用方法描述
commit()提交事务。对支持事务的数据库和表,如果提交修改操作,不适用这个方法,则不会写到数据库中
rollback()事务回滚。对支持事务的数据库和表,如果执行此方法,则回滚当前事务。在没有commit()前提下。
cursor([cursorclass])创建一个游标对象。所有的sql语句的执行都要在游标对象下进行。MySQL本身不支持游标,MySQLdb模块对其游标进行了仿真。
游标对象常用方法描述
close()关闭游标
execute(sql)执行sql语句
executemany(sql)执行多条sql语句
fetchone()从运行结果中取第一条记录,返回字典
fetchmany(n)从运行结果中取n条记录,返回列表
fetchall()从运行结果中取所有记录,返回列表

1.3 常用语句

1.插入数据。

import pymysql
conn = pymysql.connect(host='192.168.161.132',port=3306,user='root',password='123456',db='test',charset='utf8',cursorclass=pymysql.cursors.DictCursor)
cursor = conn.cursor()##插入一条数据。
sql = "insert into user(username, password) values('wuhan', '88')"
cursor.execute(sql)
conn.commit()
conn.close()    ##关闭游标##插入多条数据。
sql = "insert into user(username, password) values(%s,%s)"
args = [('beijing',222),('shenzheng',9990)]
cursor.executemany(sql,args)
conn.commit()
conn.close()    ##关闭游标

在这里插入图片描述

2.查询数据。

import pymysql
conn = pymysql.connect(host='192.168.161.132',port=3306,user='root',password='123456',db='test',charset='utf8',cursorclass=pymysql.cursors.DictCursor)
cursor = conn.cursor()##查询数据。
sql = "select * from user"
cursor.execute(sql)
print(cursor.fetchone())   ##获取第一条记录。
print(cursor.fetchmany(1))   ##从运行结果中,获取1条记录。
print(cursor.fetchall())   ##获取所有记录。
conn.close()    ##关闭游标

在这里插入图片描述

3.修改数据。

import pymysql
conn = pymysql.connect(host='192.168.161.132',port=3306,user='root',password='123456',db='test',charset='utf8',cursorclass=pymysql.cursors.DictCursor)
cursor = conn.cursor()##修改数据。
sql = "update user set password='100' where username='wuhan'"
cursor.execute(sql)
conn.commit()
conn.close()    ##关闭游标

在这里插入图片描述
4.删除数据。

import pymysql
conn = pymysql.connect(host='192.168.161.132',port=3306,user='root',password='123456',db='test',charset='utf8',cursorclass=pymysql.cursors.DictCursor)
cursor = conn.cursor()##删除数据。
sql = "delete from user where username='qingjun'"
cursor.execute(sql)
conn.commit()
conn.close()    ##关闭游标

在这里插入图片描述

5.遍历查询结果。

try:with conn.cursor() as cursor:sql = "select id,username,password from user"cursor.execute(sql)result = cursor.fetchall()for dict in result:print(f"ID: {dict['id']}, 用户名: {dict['username']}, 密码: {dict['password']}")
finally:    ##不管try是否执行成功,finally都执行。conn.close()

在这里插入图片描述

二、正则表达式

  • 正则表达式是对字符串操作的一种逻辑方式,就是用实现定义好的一些特定字符及这些特定字符的组合,组成一个规则字符串,这个规则字符串就是表达对字符串的逻辑,给定一个正则表达式和另一个字符串,通过正则表达式从字符串我们想要的部分。
  • Python正则表达式主要由re标准库提供,拥有了基本所有的表达式。

2.1 匹配方式

方法描述
re.compile(pattern, flags=0)把正则表达式编译成一个对象。
pattern 指的是正则表达式,flags是标志位的修饰符,用于控制表达式匹配模式
re.match(pattern, string, flags=0)匹配字符串开始,如果不匹配返回None
re.search(pattern, string, flags=0)扫描字符串寻找匹配,如果符合返回一个匹配对象并终止匹配,否则返回None
re.split(pattern, string, maxsplit=0, flags=0)以匹配模式作为分隔符,切分字符串为列表
re.findall(pattern, string, flags=0)以列表形式返回所有匹配的字符串
re.finditer(pattern, string, flags=0)以迭代器形式返回所有匹配的字符串
re.sub(pattern, repl, string, count=0, flags=0)字符串替换,repl替换匹配的字符串,repl可以是一个函数

1.老方法匹配字符串。优点是,方便再次使用。

a = 'this is jdasi1!#@sjkdjalk'import re
pattern = re.compile("this")  ##预定义正则表达式。
baimu = pattern.match(a)   ##使用预定义的正则表达式匹配字符串,
print(baimu)
print(baimu.group())   ##过滤出匹配的字符串。

在这里插入图片描述
2.常用方式匹配,优点是,更直观。从第一个字符串开始匹配。

a = 'this is jdasi1!#@sjkdjalk'import re
qingjun = re.match("this",a)
print(qingjun.group())

在这里插入图片描述
3.扫描匹配。

import re
s = "我今年23335岁"
result2 = re.search("\d+", s)
print(result2.group())

在这里插入图片描述
4.以匹配模式作为分隔符,切分字符串为列表。

import re
s = "我今年23335岁"
result2 = re.split("\d+", s)   ##\d+作为分隔符。
print(result2)

在这里插入图片描述
5.以列表形式返回所有匹配的字符串。

import re
s = "我今年23335岁,张三今年22岁"
result2 = re.findall("\d+", s)   ##匹配字符串中所有的数字,并返回一个列表,
print(result2)

在这里插入图片描述
6.替换匹配。

import re
s = "我今年23335岁,张三今年22岁"
result2 = re.sub("\d+","50",s)   ##将字符串中的所有数字替换成50
print(result2)

在这里插入图片描述

2.2 字符匹配

字符匹配描述
.任意单个字符(除了\n)
[ ]匹配中括号中的任意1个字符。并且特殊字符写在[ ]会被当成普通字符来匹配
[ .-.]匹配中括号中范围内的任意1个字符,例如[a-z],[0-9]
[^]匹配 [^字符] 之外的任意一个字符
\d匹配数字,等效[0-9]
\D匹配非数字字符,等效[^0-9]
\s匹配单个空白字符(空格、Tab键),等效[\t\n\r\f\v]
\S匹配空白字符之外的所有字符,等效[^\t\n\r\f\v]
\w匹配字母、数字、下划线,等效[a-zA-Z0-9_]
\W与\w相反,等效[^a-zA-Z0-9_]

1.匹配单个字符,使用"."

a = 'this is jdasi1!#@sjkdjalk'
import reqingjun1 = re.match(".",a)
qingjun2 = re.match("..",a)
qingjun3 = re.match("...",a)
print(qingjun1.group())
print(qingjun2.group())
print(qingjun3.group())

在这里插入图片描述
2.匹配[ ]中任意一个字符。

a = 'this is jdasi1!#@sjkdjalk'
import reqingjun1 = re.match("[tZZx]",a)
qingjun2 = re.match("[tZZx][shj]",a)
qingjun3 = re.match("[tZZx][shj][iOk]",a)     ##第1个[]匹配字符串中第1个字符,第2个[]匹配字符串中第1个字符,以此类推。
qingjun4 = re.match("[^i]",a)       ##取反匹配,匹配除i之外的任意字符,所以能匹配到t。
qingjun5 = re.match("[a-z][a-k]",a)     ##匹配a~z中任意字符。
print(qingjun1.group())
print(qingjun2.group())
print(qingjun3.group())
print(qingjun4.group())
print(qingjun5.group())

在这里插入图片描述

3.匹配数字,”\d“。

a = '99isl3'
import reqingjun1 = re.match("[0-9]",a)
qingjun2 = re.match("[0-9][0-9]",a)
qingjun3 = re.match("[0-9][0-9][a-z]",a)
qingjun4 = re.match("\d\d",a)       ## \d等同于[0-9]
qingjun5 = re.match("\d\d[a-z]",a)
qingjun6 = re.match("\d\d\D",a)    ## \D等同于[^0-9]
print(qingjun1.group())
print(qingjun2.group())
print(qingjun3.group())
print(qingjun4.group())
print(qingjun5.group())
print(qingjun6.group())

在这里插入图片描述
4.匹配单个空白字符,”\s“。

a = '99 isl3'
import reqingjun3 = re.match("\d\d\s\D",a)
qingjun4 = re.match("[0-9][0-9]\s[a-z]",a)
print(qingjun3.group())
print(qingjun4.group())

在这里插入图片描述
5.匹配空白字符之外的所有字符,”\S“。

a = '99 isl3'
import reqingjun3 = re.match("\d\d\s\D",a)
qingjun4 = re.match("[0-9][0-9]\s[a-z]",a)
qingjun5 = re.match("\S\S\s[a-z]",a)
print(qingjun3.group())
print(qingjun4.group())
print(qingjun5.group())

在这里插入图片描述
6.匹配字母、数字、下划线,“\w”

a = '99 _\sl3'
import reqingjun3 = re.match("\d\d\s\w\D",a)   ##  \w等效[a-zA-Z0-9_]
print(qingjun3.group())

在这里插入图片描述
7.自动转义,”r““表示原始字符串,有了它,字符串里的特殊意义符号就会自动加转义符。

a = '99\\aks'
import reqingjun3 = re.match("\d\d\\\\[a-z][a-z][a-z]",a)    ##不加r,则需要额外对\转义。
qingjun4 = re.match(r"\d\d\\[a-z][a-z][a-z]",a)    ##加r,自动对\转义。
print(qingjun3)
print(qingjun4)

在这里插入图片描述

2.3 数量匹配

字符描述
*匹配前面的子表达式0次或多次(无限次)
+匹配前面的子表达式1次或多次
匹配前面的子表达式0次或1次
{n}匹配花括号前面字符n个字符
{n,}匹配花括号前面字符至少n个字符
{n,m}匹配花括号前面字符至少n个字符,最多m个字符

1.匹配0次或无限次,“ * ”的用法。

a = 'dddjsksls'
import reqingjun3 = re.match(".*",a)   ##匹配所有字符。
qingjun4 = re.match(r"d*",a)    ##匹配d出现的0次或多次。
qingjun5 = re.match(r"dddj*",a)    ##匹配j出现的0次或多次。
print(qingjun3.group())
print(qingjun4.group())
print(qingjun5.group())

在这里插入图片描述

2.匹配1次或多次,“ + ”的用法。

a = 'dddjsksls'
import reqingjun3 = re.match(".*",a)   ##匹配所有字符。
qingjun4 = re.match(r"d+",a)    ##匹配d出现的1次或多次。
qingjun5 = re.match(r"\D+",a)    ##前面字符出现1次或多次。
print(qingjun3.group())
print(qingjun4.group())
print(qingjun5.group())

在这里插入图片描述
3.匹配1次或多次,“ ? ”的用法。

a = 'dddjsksls'
import reqingjun3 = re.match(".*",a)   ##匹配所有字符。
qingjun4 = re.match(r"dd?",a)    ##匹配d出现的0次或1次。
qingjun5 = re.match(r"\D?",a)    ##前面字符出现0次或1次。
print(qingjun3.group())
print(qingjun4.group())
print(qingjun5.group())

在这里插入图片描述
4.限制匹配,只匹配{ n }前的n个字符,超过n个字符的之外所有字符都不能被匹配到。

a = '136182290672292'
import reqingjun3 = re.match(".*",a)   ##匹配所有字符。
qingjun4 = re.match(r"\d+",a)    ##匹配所有字符。
qingjun5 = re.match(r"\d{11}",a)    ##限制匹配前11位字符。
print(qingjun3.group())
print(qingjun4.group())
print(qingjun5.group())

在这里插入图片描述
5.限制匹配,至少匹配{ n, }中n个字符。

a = '136182290672292'
import reqingjun3 = re.match(".*",a)   ##匹配所有字符。
qingjun4 = re.match(r"\d+",a)    ##匹配所有字符。
qingjun5 = re.match(r"\d{11}",a)    ##限制匹配前11位字符。
qingjun6 = re.match(r"\d{11,}",a)    ##至少匹配前11位字符。
print(qingjun3.group())
print(qingjun4.group())
print(qingjun5.group())
print(qingjun6.group())

在这里插入图片描述
6.限制匹配,至少匹配{ n,m }中前n位字符,且至多匹配前m位字符。

a = '136182290672292'
import reqingjun3 = re.match(".*",a)   ##匹配所有字符。
qingjun4 = re.match(r"\d+",a)    ##匹配所有字符。
qingjun5 = re.match(r"\d{11}",a)    ##限制匹配前11位字符。
qingjun6 = re.match(r"\d{11,}",a)    ##至少匹配前11位字符。
qingjun7 = re.match(r"\d{11,13}",a)    ##至少匹配前11位,至多匹配13位字符。
print(qingjun3.group())
print(qingjun4.group())
print(qingjun5.group())
print(qingjun6.group())
print(qingjun7.group())

在这里插入图片描述

2.4 边界匹配

字符描述
^匹配以什么开头
$匹配以什么结尾
\b匹配单词边界
\B匹配非单词边界

1.例一,判断用户输入的邮箱格式。

import reemail = input("请输入你的邮箱:")
qingjun = re.match('^\w+@[a-z]+\.[a-z]+$',email)   #2571788322@qq.com
if qingjun:print("格式正确!")
else:print("格式错误!")

在这里插入图片描述

2.5 分组匹配

字符描述
|匹配竖杠两边的任意一个正则表达式
(re)匹配小括号中正则表达式。使用\n反向引用,n是数字,从1开始编号,表示引用第n个分组匹配的内容。
(?Pre)分组别名,name是表示分组名称
(?P=name)引用分组别名

1.分组选择匹配,能匹配中()中的任意一个。

##判断用户输入的邮箱格式。
import reemail = input("请输入你的邮箱:")
qingjun = re.match('^(\w|-)+@[a-z]+\.(com|163)+$',email)   #-2571788322@qq.com、-2571788322@qq.163
if qingjun:print("格式正确!")
else:print("格式错误!")

在这里插入图片描述
在这里插入图片描述
2.引用分组。

import re
s = '<f1>18213921321<f1>'
qingjun1 = re.match('<(\w+).*<(\w+)>',s)   ##qingjun1效果等于qingjun2。
qingjun2 = re.match('<(\w+).*<(\\1)>',s)  ##正常语法是\n,n为数字,这里需要转义一下,表示引用第一个分组结果。print(qingjun2.group())   ##匹配所有分组。
print(qingjun2.group(1))   ##匹配第1个分组。
print(qingjun2.group(2))   ##匹配第2个分组。

在这里插入图片描述

3.分组别名引用。

import re
s = '<f1>18213921321<f1>'
qingjun = re.match('<(?P<baimu1>\w+).*<(?P<baimu2>\w+)>',s)  ##常对分组定义别名,因为引用数字容易出错。
print(qingjun.group())   ##匹配所有分组
print(qingjun.group("baimu1"))   ##引用baimu1分组内容。
print(qingjun.group("baimu2"))   ##引用baimu2分组内容。

在这里插入图片描述

2.6 贪婪模式&非贪婪模式

  • 贪婪模式:尽可能最多匹配。
  • 非贪婪模式:尽可能最少匹配,一般在量词(*、+)后面加个?问号就是非贪婪模式。

1.例一,贪婪模式和非贪婪模式的区别。

import re
s = "hello 666666"
result = re.match("hello 6+", s) # 贪婪匹配
print(result)
result = re.match("hello 6+?", s) # 非贪婪匹配
print(result)

在这里插入图片描述
2.例2,贪婪模式。

import re
s = "我今年23335岁"
result = re.match("\w+(\d+)\w+", s) # 贪婪匹配
print(result.group(1))

在这里插入图片描述
3.例三,非贪婪模式。

import re
s = "我今年23335岁"
result = re.match("\w+?(\d+)\w+", s) # 贪婪匹配
print(result.group(1))

在这里插入图片描述

2.7 标志位

字符描述
re.I/re.IGNORECASE忽略大小写
re.S/re.DOTAIL匹配所有字符,包括换行符\n,如果没这个标志将匹配除了换行符

1.忽略大小写匹配。

import re
s = "hello world"
result1 = re.match("Hello",s)
print(result1)result2 = re.match("Hello",s,re.I)   ##写法一。
print(result2) result3 = re.match("Hello",s,re.IGNORECASE)    ##写法二。
print(result3)

在这里插入图片描述
2.匹配所有字符,包括换行符。

import re
s = """hello
world
"""result2 = re.match("h.*",s,re.S)  
print(result2)

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/73928.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

RequestRespons

文章目录 Request&Respons1 Request和Response的概述2 Request对象2.1 Request继承体系2.2 Request获取请求数据2.2.1 获取请求行数据2.2.2 获取请求头数据2.2.3 获取请求体数据2.2.4 获取请求参数的通用方式 2.3 IDEA快速创建Servlet2.4 请求参数中文乱码问题2.4.1 POST请…

Python标准库-追踪异常,定位问题-traceback

在日常的编程过程中&#xff0c;我们经常会遇到各种错误和异常。而当程序发生异常时&#xff0c;了解如何有效地追踪异常信息并定位问题&#xff0c;是每个开发者必备的技能之一。 Python 提供了一个强大的工具&#xff0c;称为 Traceback&#xff0c;它可以帮助我们跟踪异常的…

Python自动化实战之使用Selenium进行Web自动化详解

概要 为了完成一项重复的任务&#xff0c;你需要在网站上进行大量的点击和操作&#xff0c;每次都要浪费大量的时间和精力。Python的Selenium库就可以自动化完成这些任务。 在本篇文章中&#xff0c;我们将会介绍如何使用Python的Selenium库进行Web自动化&#xff0c;以及如何…

《游戏编程模式》学习笔记(七)状态模式 State Pattern

状态模式的定义 允许对象在当内部状态改变时改变其行为&#xff0c;就好像此对象改变了自己的类一样。 举个例子 在书的示例里要求你写一个人物控制器&#xff0c;实现跳跃功能 直觉上来说&#xff0c;我们代码会这么写&#xff1a; void Heroine::handleInput(Input input…

PHP-MD5注入

0x00 前言 有些零散的知识未曾关注过&#xff0c;偶然捡起反而更加欢喜。 0x01 md5 注入绕过 md5函数有两个参数&#xff0c;第一个参数是要进行md5的值&#xff0c;第二个值默认为false&#xff0c;如果为true则返回16位原始二进制格式的字符串。意思就是会将md5后的结果当…

.NET Core6.0使用NPOI导入导出Excel

一、使用NPOI导出Excel //引入NPOI包 HTML <input type"button" class"layui-btn layui-btn-blue2 layui-btn-sm" id"ExportExcel" onclick"ExportExcel()" value"导出" />JS //导出Excelfunction ExportExcel() {…

Jenkins 监控dist.zip文件内容发生变化 触发自动部署

为Jenkins添加plugin http://xx:xx/manage 创建一个任务 构建触发器 每3分钟扫描一次&#xff0c;发现指定文件build.zip文件的MD5发生变化后 触发任务

vscode搭建java开发环境

一、配置extensions环境变量VSCODE_EXTENSIONS 该环境变量路径下的存放安装组件&#xff1a; 二、setting配置文件 {"java.jdt.ls.java.home": "e:\\software\\jdk\\jdk17",// java运行环境"java.configuration.runtimes": [{"name":…

CMake语法复习

前言 此文总结了库的制作和一些CMake常用的一些语法。 一&#xff1a;创建静态库和动态库 静态库的生成和使用 动态库的生成和使用 二&#xff1a;使用CMake来生成Makefile&#xff0c;生成可执行文件 顶层目录下的CMakeLists.txt project(HELLO) add_subdirectory(libhell…

零基础自学:2023 年的今天,请谨慎进入网络安全行业

前言 2023 年的今天&#xff0c;慎重进入网安行业吧&#xff0c;目前来说信息安全方向的就业对于学历的容忍度比软件开发要大得多&#xff0c;还有很多高中被挖过来的大佬。 理由很简单&#xff0c;目前来说&#xff0c;信息安全的圈子人少&#xff0c;985、211 院校很多都才…

Docker碎碎念

docker和虚拟机的区别 虚拟机&#xff08;VM&#xff09;是通过在物理硬件上运行一个完整的操作系统来实现的。 每个虚拟机都有自己的内核、设备驱动程序和用户空间&#xff0c;它们是相互独立且完全隔离的。 虚拟机可以在不同的物理服务器之间迁移&#xff0c;因为它们是以整…

【刷题笔记8.17】LeetCode:最长公共前缀

LeetCode&#xff1a;最长公共前缀 &#xff08;一&#xff09;题目描述 编写一个函数来查找字符串数组中的最长公共前缀。 如果不存在公共前缀&#xff0c;返回空字符串 “”。 &#xff08;二&#xff09;分析 纵向扫描时&#xff0c;从前往后遍历所有字符串的每一列&am…