R语言——文件读写(三)

目录

一、获取数据

二、读取文件

三、写入文件

四、读写Excel文件

五、读写R格式的文件

参考


一、获取数据

获取数据的三种途径:

1. 利用键盘来输入数据

2. 通过读取存储在外部文件上的数据

3. 通过访问数据库系统来获取数据

edit():定义一个数据编辑器,可直接输入修改数据,关闭编辑器,数据自动保存到变量中,注意这里需要将修改后的数据重新指向一个变量名,才可以成功保存

fix():可以直接修改并保存,不需要重新定义变量名

通过访问数据库系统来获取数据

ODBC是开放数据库连接Open Database Connectivity的简称。

install.packages("RODBC"):安装ODBC

二、读取文件

read.table('文件路径'):注意这里的路径用" \\ "或" / "。

sep:表示用什么分隔符分隔字段,默认为以空格分隔

如果文件过长,可以用head(x, n=10),tail(x, n=10)打开前十行或后十行。

header:作用是在读取数据时,是否将第一行数据作为变量的名称。

skip:表示跳过部分行内容,表示从第几行读数据

这里跳过了第一行的表头信息

nrows:读取文件的部分内容,表示读多少行

配合skip则可以读取文件中的任意行,表示从 skip 开始读,读 nrows 行

如果已知文件中使用什么符号代表缺失值,则可以使用 na.strings 替换为 “NA”

read.csv(x, sep=";"):默认分隔符为“ ,”,可以直接用来读取csv文件,也可以设置sep修改分隔符为“ ;”或其他

read.delim(x, sep='\t'):可以使用制表符进行分隔

如果想要读取的文件不在本地,R也支持读取网络文件

将本地路径修改为网络文件地址即可

read.table('https://codeload.github/masterpeace')  # 会被墙

install.packages('XML') : 安装XML包

使用 readHTMLTable 读取网页中的数据

R可以导入其他统计软件格式的数据,如SPSS等

R 可以直接读取压缩文件

read.table(gzfile("input.txt.gz")

不规则格式文件的读取

readLines(file, n):读取一行数据,n为读取的行数

三、写入文件

写入文件

write.table(b, file = 'E:\\R\\R_file\\new_file.csv')

数据被写在一个单元中

write.table(b, file = 'E:\\R\\R_file\\new_file.csv',sep = ','):添加分隔符

写入文件时,R又自动添加了行号

write.table(b, file = 'E:\\R\\R_file\\new_file.csv',sep = ',', row.names = F):定义row.names为FALSE, 不添加行号

write.table(b, file = 'E:\\R\\R_file\\new_file.txt',sep = ',', row.names = F):R会为字符串自动天添加双引号

如果不想要双引号,则定义 “quote”参数为“FALSE”。

write.table(b, file = 'E:\\R\\R_file\\new_file.txt',sep = ',', row.names = F, quote = F)

追加写入:write.table(b, file = 'E:\\R\\R_file\\new_file.txt',sep = ',', row.names = F,col.names = F, quote = F,append = T)

直接写成压缩文件:write.table(b, gzfile('E:\\R\\R_file\\new_file.txt.gz'))

写成其他统计软件支持的格式

help(package='foreign')

四、读写Excel文件

将.xlsx 文件转为 .csv 文件读取 

使用read.csv()

使用read.Clipboard()

如果 .xlsx 文件中包含多个工作表,则存为.csv 的方式就不适用了。

使用 readxl 包

install.packages('readxl')

library(readxl)

a <- read_xlsx(parh, sheet = 'sheet_name')

使用 openxlsx 包

install.packages('openxlsx')

library(openxlsx)

a<-read.xlsx("test.xlsx",sheet=1)

五、读写R格式的文件

        存储为R文件会有很多优势,R会对存储为内部文件格式的数据进行自动压缩处理,并且会存储所有与待存储对象相关的R元数据。如果数据中包含了因子,日期和时间或者类的属性等信息,这种存储方式,显得更加实用。

RDS保存单个R对象

读取 iris 数据集并存储为 RDS格式文件

saveRDS(iris, file = 'E:\\R\\R_file\\iris.RDS')

读取RDS文件

x <- readRDS('E:\\R\\R_file\\iris.RDS')

Rdata可以保存多个R对象

保存Rdata文件

save(iris, iris3, file = 'iris.Rdata')

保存工作空间中的所有对象 

save.image()

或者在命令行输入 q() ,选择 “y” ,则在退出R studio之前将工作空间保存在当前工作目录下。

加载Rdata文件:load(path)

加载 Rdata 文件,并不会提示加载了那些对象,可在 R studio 右上角窗口的 Environment 中查看有哪些对象。

或者点击左上角 File → Save 保存工作空间

点击 File → Open Project 打开工作空间

Rdata中的对象与当前工作空间的对象名冲突,此时加载Rdata则会覆盖掉当前空间中的对象。

参考

R语言入门与数据分析

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/288284.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SpringBoot 多环境开发配置文件

在开发过程中&#xff0c;往往开发环境和生产环境需要不同的配置。为了兼容两种运行环境&#xff0c;提高开发效率&#xff0c;可以使用多环境开发配置文件。 配置文件结构大概是这样&#xff1a; application.yml -主启动配置文件&#xff08;用于控制使用哪种环境配…

docker安装sonar后集成本地代码进行质量分析

背景 在完成代码后&#xff0c;想做一个较低层级的代码自检&#xff0c;来完善自己代码的质量 技术选型 在结合现有项目情况下&#xff0c;结合Jenkins走CI CD过程&#xff0c;选择了sonarqube 安装 下载地址:自己搜 安装教程我来出,首先sonarqube完整的过程分了两部分&…

【操作系统】快速做题向 如果在限制为两道的多道批处理系统,有N个作业进入系统,作业调度采用XXX算法,进程调度采用XXX算法 题型解法

如下类似的题该怎么解&#xff1f; 要搞清楚什么是作业调度&#xff0c;什么是进程调度&#xff08;处理器调度的层次的知识点&#xff09; 把上面的读一下 不严谨的说就是&#xff0c;系统 调度 作业&#xff0c;这里就是 作业调度&#xff0c;这里就会用到某种调度算法&…

【Linux】查看Java进程并编写脚本停止和启动

&#x1f604;手动停止和启动 假设Jar包名称为 ikun666.jar 1. 通过命令查看java进程 ps -aux | grep java2. kill掉进程 kill -9 你jar包的进程号3. 启动jar包 nohup java -jar ikun666.jar >/dev/null 2>&1 &&#x1f604;编写脚本 获取进程号 方式一&a…

nodejs连接mongodb报错SyntaxError: Unexpected token .

nodejs连接mongodb报错SyntaxError: Unexpected token 如下图 经过排查&#xff0c;原因是npm默认安装的mongodb插件是最新版6.3.0 &#xff0c;而mongodb数据库版本是4.0.0 &#xff0c;两者版本不同导致nodejs报错。 解决方法是npm卸载新版本的mongodb插件&#xff0c;再安…

SpringBoot actuator应用监控

文章目录 引入依赖端点(Endpoints)端点种类端点开启配置暴露端点手动暴露端点 端点保护引入spring security依赖配置security 端点响应缓存访问端点路径修改CORS跨域支持健康信息(/actuator/health)自定义healthInfo 应用信息(/actuator/info) 监控信息可视化引入依赖配置查看配…

CentOS安装jdk

1、查看可安装版本 yum -y list java* 2、安装jdk1.8版本 yum -y install java-1.8.0-openjdk 3、查看版本 java -version 4、安装目录为&#xff1a; /usr/lib/jvm 5、卸载 yum -y remove java-1.8.0-openjdk

【python基础】-- yarn add 添加依赖的各种类型

目录 1、安装 yarn 1.1 使用npm安装 1.2 查看版本 1.3 yarn 淘宝源配置 2、安装命令说明 2.1 yarn add&#xff08;会更新package.json和yarn.lock&#xff09; 2.2 yarn install 2.3 一些操作 2.3.1 发布包 2.3.2 移除一个包 2.3.3 更新一个依赖 2.3.4 运行脚本 …

【Android Studio】各个版本下载地址

下载地址&#xff1a; https://developer.android.com/studio/archive?hlzh-cn

LeetCode刷题--- 子集

个人主页&#xff1a;元清加油_【C】,【C语言】,【数据结构与算法】-CSDN博客 个人专栏 力扣递归算法题【 http://t.csdnimg.cn/yUl2I 】【C】 【 http://t.csdnimg.cn/6AbpV 】数据结构与算法【 http://t.csdnimg.cn/hKh2l 】 前言&#xff1a;这个专栏主要讲…

【大数据实训】python石油大数据可视化(八)

2014到2020年石油加工产品产量数据处理分析 一、任务描述 石油是工业的命脉。 一直到2020年&#xff0c;我国原油产量基本处于平稳的状态&#xff0c;大部分原油来自国外进口&#xff1b;中国原油加工产量在华东、东北地区占比较大&#xff0c;华南地区相对较少。原油的加工…

融云观察:给 ChatGPT 加上声音和脸庞,AI 社交的多模态试验

&#xff08;&#x1f446;点击获取行业首款《社交泛娱乐出海作战地图》&#xff09; 如果将短剧的爆火简单粗暴地归因为剧情上头、狗血反转和精妙卡点&#xff0c;那 GenAI 世界这一年来可以说是一部短剧 Live Show。关注【融云全球互联网通信云】了解更多 这厢 Open AI 宫斗…