【Python基础021】Python中的何如实现文件的读写

        Python中文件的读写在程序运行过程中是一个非常重要的操作,我们通常会将一些大量的临时数据暂时存放到一个临时文件,这就需要用到文件的读取与写入功能。话不多说,我们直接上才艺。

1、文本文件和二进制文件

        讲文件读写前,先说说文件中的数据组织形式,具体可以把文件分成文本文件和二进制文件两大类。

        (1)文本文件

        文本文件一般存储普通“字符”文本,在python中默认为unicode字符集(两个字节表示一个字符,最多可以表示65536个),可以使用记事本程序打开。

        (2)二进制文件

        二进制文件把数据内容用“字节”进行存储,无法用记事本打开。可以用Notepad++软件打开。

2、文件操作相关模块

        文件操作相关模块

模块名称

说明

io

文件流的输入和输出操作input output

os

基本操作系统功能,包括文件操作

glob

查找符合特定规则的文件路径名

fnmatch

使用模式来匹配文件路径名

fileinput

处理多个输入文件

filecmp

用于文件的比较

cvs

用于csv文件的处理

pickle和cPickle

用于序列化和反序列化

xml

用于xml数据处理

bz2, gzip,zipfile,zlib,tarfilc

用于处理压缩和解压缩文件

3、打开文件

        (1)打开文件方法语法

        Python中用open()方法来打开一个文件,并返回文件对象,在对文件进行处理过程中如果文件无法不存在的话,会抛出FileNotFoundError的错误

        这里需要注意一点:用open()方法打开文件后,不使用了一定要保证关闭文件对象,即调用close()方法,不然文件对象会一直存在,要是文件很大的话你的内存会占爆。

        open()方法的完整语法格式如下

open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)

其中:

        file: 必需,文件路径(相对或绝对)

        mode: 可选,文件打开模式,默认为“读取”模式

        buffering:设置缓冲

        encoding:编码格式,一般为utf-8

        errors:报错级别

        newline:区分换行符

        closefd:传入file的参数类型

        opener:设置自定义开启器,开启器的返回值必需是一个打开的文件描述符

        简化版格式如下

open(file, mode='r')

        (2)打开模式参数

        默认为文本模式,如果要以二进制模式打开,加上 b 。

模式

描述

t

文本模式

x

写模式,新建一个文件,如果该文件已存在则会报错

b

二进制模式

+

打开一个文件进行更新

U

通用换行模式

r

以只读方式打开文件。文件的指针将会放在文件的开头。(默认模式)

rb

以二进制格式打开一个文件用于只读。文件的指针将会放在文件的开头。

r+

打开一个文件用于读写。文件的指针将会放在文件的开头。

rb+

以二进制格式打开一个文件用于读写。文件的指针将会放在文件的开头。

w

打开一个文件只用于写入。如果该文件已存在则打开文件,并从头开始编辑,即原来的内容会被删除。如果该文件不存在,则创建新文件。

wb

以二进制格式打开一个文件用于写入。如果该文件已存在则打开文件,并从头开始编辑,即原来的内容会被删除。如果该文件不存在,则创建新文件。

w+

打开一个文件用于读写,如果该文件已存在则打开文件,并从头开始编辑,即原来的内容会被删除。如果该文件不存在,则创建新文件。

wb+

以二进制格式打开一个文件用于读写,如果该文件已存在则打开文件,并从头开始编辑,即原来的内容会被删除。如果该文件不存在,则创建新文件。

a

打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是,新的内容会被写入到已有内容的之后。如果该文件不存在,则创建新文件写入。

ab

以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是,新的内容会被写入到已有内容的之后。如果该文件不存在,则创建新文件写入。

a+

打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。也就是,新的内容会被写入到已有内容的之后。如果该文件不存在,则创建新文件写入。

ab+

以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是,新的内容会被写入到已有内容的之后。如果该文件不存在,则创建新文件写入。

        (3)file对象操作方法

        对文件对象进行操作的常用函数如下

方法

描述

file.close()

关闭文件,关闭后文件不能再进行读写操作

file.flush()

刷新文件内部缓冲,直接把内部缓冲区的数据立刻写入文件,而不是被动的等到输出缓冲区写入

file.fileno()

返回一个整型的文件描述符,可以用在如os模块的read方法等一些底层操作上

file.isatty()

如果文件连接到一个终端设备返回True,否则返回false

file.next()

返回文件下一行

file.read([size])

从文件读取指定的字节数,如果未给定或为负则读取所有

file.readline([size])

读取整行,包括‘\n’字符

file.readlines([sizeint])

读取所有行并返回列表,若给定sizeint>0,返回总和大约为sizeint字节的行,实际读取值可能比sizeint较大,因为需要填充缓冲区

file.seek(offset)

设置文件当前指针位置

file.tell()

返回文件当前指针位置

file.truncate([size])

截取文件,截取的字节通过size指定,默认为当前文件指针位置

file.write([size])

将字符串写入文件,没有返回值。

file.writelines(sequence)

向文件写入一个序列字符串列表,如果需要换行则需要自己加入换行符

4、文件的读写

        (1)读取文件

        如果文件打开成功,接下来,调用 read()方法可以一次读取文件的全部内容,Python 把内容读到内存。调用 close()方法关闭文件。文件使用完毕后必须关闭,因为文件对象会占用操作系统的资源,并且操作系统同一时间能打开的文件数量也是有限的。

        1)read()方法

file = open('test.txt', 'r')text = file.read()print(text)file.close()

        这里一定要记住在最后要关闭文件,不要文件会一直占用你的内容。但是遇到打开文件后,需要写的程序太长的话,这种方法很容易到最后忘记写file.close()去关闭文件,所以,Python引入了with语句来自动调用close()方法关闭文件。

with open('test.txt', 'r') as file:print(file.read())

        从上面的操作方法以及实际运用中我们可以知道file.read()方法如果不给定参数,是默认读取文件中的全部内容,那么如果文件有10G,那你的内存会直接爆炸,所有当你需要导入的文件内容很多时,可以传入size参数,反复调用read(size)方法来获取文件内容。其中size为整数,表示从文件指针的位置开始读取size个字节。

        这里多说一句什么是指针

        在读取文件中的指针就是代表从文件的哪个位置开始读取文件,每次读取到哪个位置,指针就在哪个位置,只要你不关闭文件,那么下次你读取文件时,就会从上次读取完的位置继续读取文件内容,直到文件内容读取完毕。

with open('test.txt', 'r') as file:print(file.read(5))print(file.read(1))print(file.read(6))print(file.read(2))

        2)readline/s()方法

        readline()方法是读取文件的一行内容,包括'\n';readlines()方法是读取文件中所有行内容,并返回一个列表。

with open('test_line.txt', 'r') as file:print(file.readline()) # ABCDEFGHIJKLMNOPQRSTUVWXYZ 换行符print(file.readlines()) # ['123456789\n', 'hello python\n', 'I love Python']

        3)seek()方法

        当你上次读取了几个字节后就关闭了文件,然后下次想继续读取文件内容,并从上次读取的结尾开始读取时,就可以使用seek()方法来指定指针位置。

with open('test_line.txt', 'r') as f:f.seek(3) # 上次读取到第三个字节的位置print(f.read(4)) # DEFG

        4)tell()方法

        用于显示目前指针的位置

with open('test_line.txt', 'r') as f:print(f.read(4)) # DEFGf.tell() #4

        5)truncate()方法

        truncate()方法用于截取指针之后的内容,所以使用这个方法,文件的打开的模式必须是可写入,不然要报错。

with open('test_line.txt', 'r+') as f:f.seek(10) # 指定指针位置f.truncate()print(f.read())

        (2)写入文件

        写文件和读文件是一样的,唯一区别是调用 open()函数时,传入的文件模式是'w'或者'wb',表示写文本文件或写二进制文件。向文件写入内容使用 write(string)方法,该方法返回写入文件的字节数。

        1)write()方法

with open('test_new.txt', 'w') as f:f.write('123456')

        如果使用f.open()写文件时,操作系统往往不会立刻把数据写入磁盘,而是放到内存缓存起来,空闲的时候再慢慢写入。只有调用 f.close()方法时,操作系统才保证把没有写入的数据全部写入磁盘。忘记调用 close()的后果是数据可能只写了一部分到磁盘,剩下的丢失了。所以,使用 with语句比较好。

        2)writelines()方法

        writelines 方法需要通过参数指定一个字符串类型的列表,该方法会将列表中的每一个元素值写入文件。换行需要自己在每一行最后加入换行符 \n。

        注意,并没有 writeline 方法,写一行文本需要直接使用 write() 方法。

list1 = ['java\n', 'c\n', 'c++\n', 'python\n', 'javascript\n']with open('writelines_test.txt', 'w+') as f:f.writelines(list1)f.seek(0)list2 = f.readlines()for l in list2:print(l.strip())

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/452168.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Leetcode 热门百题斩(第三天)

介绍 针对leetcode的热门一百题,解决大多数实习生面试的基本算法题。通过我自己的思路和多种方法,供大家参考。 1.两数之和(题号:1) 方法一 最先想到的就是两个for去遍历匹配。 class Solution {public int[] twoSum(int[]…

进程中线程使用率偏高问题排查

1. top命令查看CPU使用率高的进程 2. top -H -p 15931(进程PID) 查看进程下的线程 3. printf "%x\n" 17503(线程PID) 线程PID 10进制转16进制 0x445f 4. jstack -l 15931(JVM进程PID) 导出java进程栈信息,里面包含线程nid0x445f和所在的类&#xff0…

ansible的常用模块配置说明及批量部署服务

ansible的常用模块配置说明及批量部署服务 ansible的常用模块配置说明,在远程服务器批量配置清华大学的仓库文件,批量部署nginx,并启动服务。 ansible知识点: 一、Ansible特点: 1、部署简单,只需在主控端…

生物发酵展同期论坛|2024节能环保绿色低碳发展论坛

“十四五”规划中提出,提高工业、能源领城智能化与信息 化融合,明确“低碳经济”新的战略目标,热能产业是能源产 业和民生保障的重要组成部分,也是二氧化碳排放量大的行业 之一,产业高效、清洁、低碳、灵活、智能化水平…

Rust 第一个rust程序Hello Rust️

文章目录 前言一、vscode 安装rust相关插件二、Cargo New三、vscode调试rustLLDB 前言 Rust学习系列。今天就让我们掌握第一个rust程序。Hello Rust 🦀️。 在上一篇文章我们在macOS成功安装了rust。 一、vscode 安装rust相关插件 以下是一些常用的 Rust 开发插件…

Docker基础与持续集成

docker 基础知识: docker与虚拟机 !左边为虚拟机,右边为docker环境 – Server :物理机服务器Host OS :构建的操作系统Hypervisor :一种虚拟机软件,装了之后才能虚拟化操作系统Guest OS :虚拟化的操作系统…

AI应用开发-git开源项目的一些问题及镜像解决办法

AI应用开发相关目录 本专栏包括AI应用开发相关内容分享,包括不限于AI算法部署实施细节、AI应用后端分析服务相关概念及开发技巧、AI应用后端应用服务相关概念及开发技巧、AI应用前端实现路径及开发技巧 适用于具备一定算法及Python使用基础的人群 AI应用开发流程概…

python爬虫之豆瓣首页图片爬取

网址:https://movie.douban.com/ import requests from lxml import etree import re url https://movie.douban.com headers {User-Agent : Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.5735.289 Safari/5…

小埋的解密游戏的题解

题目描述 小埋最近在玩一个解密游戏,这个游戏的解密方法是这样的,这个游戏会给你提供 个数,让我们求出这 个数里面,有多少个连续的数的平均数大于某个给定的数 。这个数可能会很大,所以我们要输出这个数对 的取模结果。现在小…

【脑电信号处理与特征提取】P7-涂毅恒:运用机器学习技术和脑电进行大脑解码

运用机器学习技术和脑电进行大脑解码 科学研究中的大脑解码 比如2019年在Nature上一篇文章,来自UCSF的Chang院士的课题组,利用大脑活动解码语言,帮助一些患者恢复语言功能。 大脑解码的重要步骤 大脑解码最重要的两步就是信号采集和信号…

Pycharm 关闭/退出烦人的Pytest模式

Pycharm 遇到:Run Python tests in ***.py ,但很多时候我们并不需要,真心烦人! 如何解决: 1 打开File-Settings (图片是新版界面,旧版同样操作) 2 Tools 中的Python Integrated Tools 在Tes…

impala与kudu进行集成

文章目录 概要Kudu与Impala整合配置Impala内部表Impala外部表Impala sql操作kuduImpala jdbc操作表如果使用了Hadoop 使用了Kerberos认证,可使用如下方式进行连接。 概要 Impala是一个开源的高效率的SQL查询引擎,用于查询存储在Hadoop分布式文件系统&am…