import pandas as pdfile = "summerOly_athletes.xlsx"# read_csv用于.csv文件
# read_excel用于.xlsx文件
df = pd.read_excel(file, header=0) # header:从第几行开始读取(下标从0开始)# print(df.columns) # columns:列索引
# print(df.index) # index:行索引# 删除有空值的行
# df = df.dropna() # 根据列截取数据
# df_name = df['Name']
# df_name_and_noc = df[['Name','NOC']] # 多列一起截取
# print(df_name)
# print(df_name_and_noc)# 根据行截取数据
# df_someone = [2] # 列表
# # print(df.loc[df_someone]) # loc函数
# print(df.iloc[3:5]) # 选连续的某些行# 利用切片截取连续行or列的数据 -- iloc函数
# iloc[行切片:列切片]
# df_1 = df.iloc[:,0:5] # 读取所有行,列为第0~4列
# print(df.iloc[3:5,0:3]) # 选连续几行中的某些列
# print(df_1)# 根据某一列的值排序
# df.sort_values(by = ['Year'], inplace=True) # inplace 表示直接修改原数据
# print(df)# # 新生成某一列
# df['mmm'] = df['Year'] // 2
# print(df)# 合并两个.xlsx文件 -- merge函数
# def read_excel_fun(file):
# data_file = pd.read_excel(file)
# return data_file# the_one = read_excel_fun('1.xlsx')
# the_two = read_excel_fun('2.xlsx')
# the_new = pd.merge(the_one, the_two, left_on='姓名', left_index=True, right_index=True, how='outer') # outer表示并集# 根据给定条件选取数据 -- 将bool类型语句用[]括上即可
# df = df[df['Year'] >= 1988]
# print(df)# 将修改内容保存到新excel文件
# df.to_excel('nw_df.xlsx')