Pandas教程(二)—— 不同格式的数据读取

前言:几种常用数据格式的介绍

  • csv文件

1.  逗号分隔值文件,以纯文本形式(记事本)存储表格数据

2.  它是一种平面文件:即只存储数据和文字,不能存储公式、图表等

3.  更适合存储大数据,一般用来批量一维或二维存储数据

4.  csv、tsv、txt都属于文本文件,只是csv以逗号分隔,tsv以制表符Tab隔开,而txt没有具体要求(逗号、制表符、空格等都可) 

CSV文件的存储方式

  • Excel文件

1.  Excel是一个电子表格,将文件保存为自己的专有格式,即xls或xlsx

2.  Excel是一个二进制文件,它不仅可以存储数据,还可以对数据进行操作

3.  不适合处理大数据

  • JSON数据

1.  JSON是一种轻量级的数据交换格式,用于存储和传输结构化数据

2.  JSON一般存储与Web浏览器中,是一种在各个编程语言中流通的数据格式(类似英语)

3.  JSON 数据的书写格式是键(名称)值对

  • XML、HXML格式

1.  XML是一种标记语言,被设计用来传输和存储数据(同JOSH),其焦点是数据的内容

2.  HTML 是超文本标记语言,被设计用来显示数据,其焦点是数据的外观

1.在python中新建文件

文件类型新建方法
csv和txt(纯文本文件)pd.to_csv(路径)
excelpd.to_excel(路径)
sqlpd.to_sql(路径)

 新建文件方法的几个参数:

        sep:分隔符

        na_rep= :  缺失值标注(默认为空字符串)

        index = :  是否写入行的标签(默认True)

        header = :是否写入列的标签(默认True)

import pandas as pd
import numpy as nproad = "D:\python code\pycharm\表格.xlsx"
data = pd.DataFrame(np.arange(9).reshape(3, 3))
print(data)
data.to_excel(road,index=False,header=False)

2.读写csv和txt文本文件

函数描述
pd.read_csv(path)从文件读取分割好的数据,默认分隔符为逗号 ,
pd.read_table(path)从文件读取分割好的数据,默认分隔符为制符表 \t
pd.read_clipboard()从粘贴板读取数据

 读写文本文件方法的几个参数:

       

        sep =:文件的分隔符;如果文件中分隔符不止一个,一般输入一个正则表达式 “\s+”

        header = :默认第一行为列名,如果不是,则输入None

        names = :  指定列名列表,和header搭配使用

        index_col = :  指定一个列,用作行名(可以输入索引名或索引编号)

        skiprows =:从开头起,需要跳过的行数或行号列表

        nrows =:从文件开头处需要读入的行数

        na_values =:需要用Na替换的值序列

 3.读取Excel文件

       操作基本和文本文件差不多(最好先装好第三方包 xlrd和openpyxl)

函数描述
pd.read_excel(path)

读入excel文件(参数参考读取文本文件)

sheet_name = :选excel中的哪个工作表(左下角)

pd.to_excel(path)新建(保存)excel文件
import pandas as pd
road = "E:\python 资料\孙兴华 数据分析教程\Pandas课件\课件\pandas教程\课件001-005\读取文件.xlsx"
data = pd.read_excel(road,header= None,names=["序号","姓名","年龄","手机","地址","日期"],index_col = 0) #读取文件
print(data)
data.to_excel(road) #保存文件

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/312389.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

docker里面不能使用vim的解决办法

docker里面不能使用vim的解决办法 目录 docker里面不能使用vim的解决办法 1.在使用时会出现 2.在使用这些都不能解决的时候考虑 3.测试是否可用 1.在使用时会出现 bash: vim: command not found 出现这种错误时首先考虑使用 apt-get update 然后在用 apt-get install …

Plantuml之EBNF语法介绍(二十七)

简介: CSDN博客专家,专注Android/Linux系统,分享多mic语音方案、音视频、编解码等技术,与大家一起成长! 优质专栏:Audio工程师进阶系列【原创干货持续更新中……】🚀 优质专栏:多媒…

数据库——建立ER模型及关系模型转换

​ 【实验内容及要求】 使用画图工具或MySQL Workbench等建模工具设计出相应的ER图,将局部ER图合并为一个整体ER模型,在ER模型中填加多样性约束,建立显示主键的ER模型,标识实体的属性,确认主键、外键。将上述ER图转化…

Kubernetes集群部署Rook Ceph实现文件存储,对象存储,块存储

Kubernetes集群部署Rook Ceph部署Ceph集群 1. Rook Ceph介绍 Rook Ceph是Rook项目中的一个存储方案,专门针对Ceph存储系统进行了优化和封装。Ceph是一个高度可扩展的分布式存储系统,提供了对象存储、块存储和文件系统的功能,广泛应用于提供…

《PCI Express体系结构导读》随记 —— 第I篇 第1章 PCI总线的基本知识(17)

接前一篇文章:《PCI Express体系结构导读》随记 —— 第I篇 第1章 PCI总线的基本知识(16) 1.4 PCI总线的中断机制 PCI总线使用INTA#、INTB#、INTC#和INTD#信号向处理器发出中断请求。这些中断请求信号为低电平有效,并与处理器的中…

2024新年快乐

今天就不讲题解了&#xff0c;2024年&#xff0c;祝所有博客身体健康&#xff0c;粉丝越多&#xff0c;点赞越高&#xff01;&#xff01;&#xff01; #include<bits/stdc.h> using namespace std; int main(){cout<<"新年快乐!!";return 0&#xff1b;…

【第5期】前端Vue使用Proxy+Vuex(store、mutations、actions)跨域调通本地后端接口

本期简介 本期要点 本地开发前后端如何跨域调用全局请求、响应处理拦截器处理封装HTTP请求模块编写API请求映射到后端API数据的状态管理 一、 本地开发前后端如何跨域调用 众所周知&#xff0c;只要前端和后端的域名或端口不一样&#xff0c;就存在跨域访问&#xff0c;例如&…

java进阶(三)

IO与网络编程 3 输入输出流IO3.1 基础定义3.2 IO框架3.3 读取字节输入流-InputStream3.3.1 InputStream.read3.3.2 FileInputStream类说明 3.4读取字符输入流Reader3.4.1 Reader.read3.4.2 FileReader类说明 3.5 字节输出流OutputStream3.5.1 OutputStream.write3.5.2 FileOutp…

Django 学习教程- Django 入门案例

Django学习教程系列 Django学习教程-介绍与安装 前言 本教程是为 Django 5.0 编写的&#xff0c;它支持 Python 3.10 至以上。如果 Django 版本不匹配&#xff0c;可以参考教程 使用右下角的版本切换器来获取你的 Django 版本 &#xff0c;或将 Django 更新到最新版本。如果…

Android Studio如何创建尺寸大小及API通用的模拟器

目录 前言 一、操作步骤 二、总结 三、更多资源 前言 在开发移动应用程序的过程中&#xff0c;使用模拟器进行测试是一种常见和方便的方式。Android Studio是一款功能强大的集成开发环境&#xff0c;它提供了创建和管理模拟器的功能。在本文中&#xff0c;我们将介绍如何创…

CGAL的AABB tree

1、介绍 AABB树组件提供了一种静态数据结构和算法&#xff0c;用于对有限的三维几何对象集进行高效的交集和距离查询。可以查询数据结构中存储的几何对象集&#xff0c;以进行交集检测、交集计算和距离计算。 交集查询可以是任何类型的&#xff0c;只要在traits类中实现了相应的…

cargo(rust包管理) 常见命令、包检索 (windows+linux)

rust环境和开发环境配置&#xff1a;rust开发环境配置 winlinux Cargo是Rust的构建系统和包管理器。 如果你的能力足够强也愿意&#xff0c;可以不用cargo进行rust开发&#xff0c;即从头开始敲代码 一、cargo包相关查询 1.查找包 查找cargo包链接&#xff1a;crates.io …