1.1、xlrd模块介绍
xlrd:用于读取Excle数据文件将返回的数据对象放到内存中,然后查询数据文件对象的相关信息。
xlwt:用于在内存中生成新的数据文件对象,处理完成后写入到Excel数据文件中。
xlutils:主要的作用就是copy新的文件对象,在新的数据对象中完成数据处理操作。
注意:在使用 xlrd 读取 .xlsx 文件时,由于 xlrd 从版本 2.0.0 开始停止支持 .xlsx 格式,可能会遇到 xlrd.biffh.XLRDError: Excel xlsx file; not supported 的错误。
如果需要读取.xlsx文件,你可能需要安装1.2.0版本的xlrd。
1.2、xlrd操作方法汇总
1.2.1、Excel操作
1.2.1.1、打开文件
import xlrdworkbook = xlrd.open_workbook('test.xls')
print(workbook) # <xlrd.book.Book object at 0x7f592100ff50>
1.2.1.2、获取所有的表名
import xlrdworkbook = xlrd.open_workbook(r'./code/excelRead/test.xls')
# 获取所有的工作表名
sheet_names = workbook.sheet_names()
print(sheet_names) # ['sdxl', 'hzgg', 'sdyxz', 'TB2018']
# 获取所有的sheet对象
Sheets = workbook.sheets()
print(Sheets) # [Sheet 0:<sdxl>, Sheet 1:<hzgg>, Sheet 2:<sdyxz>, Sheet 3:<TB2018>]
1.2.1.3、获取指定的Sheet
import xlrdworkbook = xlrd.open_workbook(r'./code/excelRead/test.xls')
# 方式一:通过索引选取
sheet1 = workbook.sheets()[0]
print(sheet1 ) # Sheet 0:<sdxl># 方式二:通过索引选取
sheet2 = workbook.sheet_by_index(2)
print(sheet2) # Sheet 2:<sdyxz># 方式三:通过表名选取,返回一个<class 'xlrd.sheet.Sheet'>对象
sheet = workbook.sheet_by_name("hzgg")
print(sheet) # Sheet 1:<hzgg>
1.2.1.4、某个sheet是否导入完毕
# 通过索引,检查某个sheet是否导入完毕
print(workbook.sheet_loaded(0)) # True
# 通过文件名,检查某个sheet是否导入完毕
print(workbook.sheet_loaded("hzgg")) # True
1.2.2、sheet对象的基本操作
1.2.2.1、sheet表行操作
1.2.2.1.1、获取表中所有的行数
import xlrdworkbook = xlrd.open_workbook(r'./code/excelRead/test.xls')
sheet2 = workbook.sheet_by_name("hzgg")
# 特别注意,这是属性而不是方法,不加括号
print(sheet2.nrows) # 17
1.2.2.1.2、返回指定行的所有单元格数值组成的列表
1.2.2.1.3、获取某行的类型及数据
1.2.2.1.4、获取某行的类型的列表
单元类型ctype:empty为0,string为1,number为2,date为3,boolean为4, error为5(左边为类型,右边为类型对应的值)
1.2.2.1.5、以切片形式获取某行的类型及数据
1.2.2.1.6、获取某行的长度
1.2.2.1.7、获取sheet的所有行生成器
1.2.2.2、sheet表列操作
1.2.2.2.1、获取有效列数
import xlrdworkbook = xlrd.open_workbook(r'./code/excelRead/test.xls')
sheet2 = workbook.sheet_by_name("hzgg")
# 获取有效列数
print(sheet2.ncols) # 9
1.2.2.2.2、获取某列数据
1.2.2.2.3、获取某列类型
1.2.2.2.4、以切片方式获取某列类型及数据
1.2.2.3、单元格操作
1.2.2.4、单元格中的日期/时间操作
在使用xlrd读取excel时,我们常常会遇到日期格式的数据,如果我们不经过任何处理,那么我们得到会是如 45089.0、45171.0 这样的excel时间戳。那么我们该如何读取呢?这里介绍俩方法。
1.2.2.4.1、xlrd.xldate_as_tuple(xldate, datemode)
xlrd.xldate_as_tuple(xldate,datemode)
:param xldate: 要处理的单元格值,自然是excel中的日期数据
:param datemode: 使用哪条基准的时间戳(0代表1900-01-01为基准,1代表1904-01-01为基准);常使用1900为基准
返回值:返回一个元组,类似于(year,month,day,hour,minute,nearest_second)
但是,仅适用于date类型的excel单元格,不适用于time类型的单元格,对于time类型的单元格值,报错:XLDateAmbiguous
1.2.2.4.2、xlrd.xldate.xldate_as_datetime(xldate, datemode)
xlrd.xldate.xldate_as_datetime(xldate,datemode)
:param xldate: 要处理的单元格值,自然是excel中的日期数据
:param datemode: 使用哪条基准的时间戳(0代表1900-01-01为基准,1代表1904-01-01为基准);常使用1900为基准
返回值:datetime对象,格式 year-month-day hour:minute:second
但是,对于time类型的单元格值,转化后自动以基准补充;如基准选择1900时,时间 13:09:30 转化后为:1900-01-01 23:08:00