什么是R语言?
R语言是用于统计分析、绘图的语言和操作环境。R语言是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。R语言是S语言的一个分支,可以认为R语言是S语言的一种实现。而S语言是由AT&T贝尔实验室开发的一种用来进行数据探索、统计分析和作图的解释型语言。最初S语言的实现版本主要是S-PLUS。S-PLUS是一个商业软件,它基于S语言,并由MathSoft公司的统计科学部进一步完善。后来新西兰奥克兰大学的Robert Gentleman和Ross Ihaka及其他志愿人员开发了一个R系统,由“R开发核心团队”负责开发。R可以看作贝尔实验室(AT&T BellLaboratories)的Rick Becker、John Chambers和Allan Wilks开发的S语言的一种实现。当然,S语言也是S-Plus的基础。所以,两者在程序语法上可以说是几乎一样的,可能只是在函数方面有细微差别。
为什么选择R语言?
除了R语言以外,市面上也有许多其他流行的统计和制图软件,如Microsoft Excel、SAS、IBM SPSS、Stata以及Minitab。为什么要选择R语言进行数据分析?
R有着非常多值得推荐的特性:
1、多数商业统计软件价格不菲,投入成千上万美元都是可能的。而R是免费的!
2、R是一个全面的统计研究平台,提供了各式各样的数据分析技术。几乎任何类型的数据分析工作皆可在R中完成。
3、R囊括了在其他软件中尚不可用的、先进的统计计算例程。事实上,新方法的更新速度是以周来计算的。
4、R拥有顶尖水准的制图功能。如果希望复杂数据可视化,那么R拥有最全面且最强大的一系列可用功能。
5、R是一个可进行交互式数据分析和探索的强大平台。举例来说,任意一个分析步骤的结果均可被轻松保存、操作,并作为进一步分析的输入。
6、R可以轻松地从各种类型的数据源导入数据,包括文本文件、数据库管理系统、统计软件,乃至专门的数据仓库。它同样可以将数据输出并写入到这些系统中。R也可以直接从网页、社交媒体网站和各种类型的在线数据服务中获取数据。
7、R是一个无与伦比的平台,在其上可使用一种简单而直接的方式编写新的统计方法。它易于扩展,并为快速编程实现新方法提供了一套十分自然的语言。
8、R的功能可以被整合进其他语言编写的应用程序,包括C++、Java、Python、PHP、Pentaho、SAS和SPSS。这让你在不同的语言环境中加入R的功能。
9、R可运行于多种平台之上,包括Windows、UNIX和Mac OS X。这基本上意味着它可以运行于你所能拥有的任何计算机上。
R语言获取及安装
R语言安装文件收存于R语言官方网站CRAN,其链接为:https://www.r-project.org/。
1、进入官方链接,点击CRAN进行镜像选择(一个镜像站点(或称镜像)是指另一个站点内容的拷贝。镜像通常用于为相同信息内容提供不同的源,特别是在下载量大的时候提供了一种可靠的网络连接。)
2、镜像涉及到下载速度,不过R语言安装文件不大,所以不同国家的镜像或同一国家的不同镜像下载时间相近,这里选择China的清华大学的镜像
3、根据自己电脑系统选择不同的安装包
4、以windows为例,点击 base,然后点击 Download R-4.4.2 for Windows 下载即为R语言安装包
5、找到下载的安装包,双击安装包,按照软件提示即可完成安装
R语言界面
2、脚本窗口
由于主页面命令行,只能一行一行运行命令,也可点击File→New script创建一个脚本窗口,可以在窗口写多行命令,然后选中多行命令,点击鼠标右键,选择Run line or selection同时运行多行命令。
R语言界面还涉及其他很多功能和设置,例如设置界面文字大小及代码文字大小、加载R语言包等,不过R语言的IDE(IntegratedDevelopment Environment,集成开发环境)—Rstudio提供了更为便捷的界面和更多的功能,这里不对R语言界面进行过多介绍。在R语言实际使用过程中,更多情况下都是使用Rstudio进行编程和开发,所以接下来也会对Rstudio进行更详细的介绍。