在Python中处理表格数据,常用的库包括pandas、openpyxl、xlrd、xlwt等。以下是一些常用的处理表格参数和方法:
使用pandas处理表格
pandas是Python中处理表格数据最强大的库之一。以下是一些常用的参数和方法:
读取表格数据
import pandas as pd
# 读取Excel文件
df = pd.read_excel('file.xlsx')
# 读取CSV文件
df = pd.read_csv('file.csv')
# 读取指定sheet的Excel文件
df = pd.read_excel('file.xlsx', sheet_name='Sheet1')
# 读取指定行和列的数据
df = pd.read_excel('file.xlsx', skiprows=5, usecols="A:C")
```
写入表格数据
# 写入Excel文件
df.to_excel('output.xlsx', index=False)
# 写入CSV文件
df.to_csv('output.csv', index=False)
# 写入指定sheet的Excel文件
with pd.ExcelWriter('output.xlsx') as writer:
df.to_excel(writer, sheet_name='Sheet1', index=False)
```
数据处理# 查看前几行数据print(df.head())# 查看数据基本信息print(df.info())# 选择特定列df_selected = df[['column1', 'column2']]# 过滤数据df_filtered = df[df['column1'] > 10]# 添加新列df['new_column'] = df['column1'] + df['column2']# 删除列df.drop('column1', axis=1, inplace=True)# 分组和聚合grouped = df.groupby('column1').sum()使用openpyxl处理Excel文件openpyxl是一个专门用于读写Excel 2010 xlsx/xlsm/xltx/xltm文件的库。读取Excel文件from openpyxl import load_workbookwb = load_workbook('file.xlsx')sheet = wb['Sheet1']for row in sheet.iter_rows(values_only=True):print(row)写入Excel文件from openpyxl import Workbookwb = Workbook()sheet = wb.activesheet['A1'] = 'Hello'sheet['B1'] = 'World'wb.save('output.xlsx')使用xlrd和xlwt处理Excel文件xlrd用于读取Excel文件,xlwt用于写入Excel文件。读取Excel文件import xlrdworkbook = xlrd.open_workbook('file.xls')sheet = workbook.sheet_by_name('Sheet1')for row_idx in range(sheet.nrows):row = sheet.row(row_idx)print([cell.value for cell in row])写入Excel文件import xlwtworkbook = xlwt.Workbook()sheet = workbook.add_sheet('Sheet1')sheet.write(0, 0, 'Hello')sheet.write(0, 1, 'World')workbook.save('output.xls')
总结
pandas:适用于大多数表格数据处理需求,功能强大且易于使用。
openpyxl:适用于需要精细控制Excel文件格式和内容的场景。
xlrd/xlwt:适用于处理旧版Excel文件(xls格式)。