R语言系统管理员
1.R语言的目录
了解R语言的主目录<即所设置的文件与安装文件放置的位置>:
Sys.getenv("R_HOME")
如果是设置的话,使用命令 Sys.putenv() Sys.setenv()
了解R 语言的library的搜寻目录,即安装包所在的路径
.libPaths()
.Library.site 设置
了解R语言的当前工作目录<是输入和输出文件默认的位置>
getwd()
设置命令是:setwd()
查看搜索列表--定位R函数和数据-- search()
加入搜索列表中 --- attach() ---移除 detach()
R语言的环境---系统的字符集
sessionInfo()
R.Version-----用户
.Platform----分隔符
.Machine---浮点型的位数
environment-环境空间--通过环境空间,封装了加载器的运行过程,
让使用者在不知道底层细节的情况下,可以任意加载使用到的第三方的R语言程序包
R语言中有5种环境的定义 全局环境,内部环境,父环境,空环境 和 包环境。
查看当前环境--environment()
.GlobalEnv
R语言中有一些辅助函数,可以帮助我们理解和使用环境空间。
new.env 创建一个环境空间
is.environment 判断是否是环境空间类型。
environment 查看函数的环境空间定义。
environmentName 查看环境空间名字。
env.profile 查看环境空间属性值。
.RData---工作空间--保存当前的R的变量和函数,在启动时自动创建,存储于计算机内存,
直到退出,退出时可以选择对其是否进行保存
不会保存当前的图形
namespace--命名空间---管理包内对象
.Rprofile--自定义启动环境
快捷键 中断而不退出R 按Ctr+C键
清除页面内容 Ctrl+L
2.包的了解
下载安装包
在线安装
install.packages("rjson")
install.packages("rjson",repos="https://mirrors.ustc.edu.cn/CRAN") ##默认镜像的名称
##选择安装库--setRepositories(),设定镜像--chooseCRANmirror()
install.packages("Rwordseg", repos = "http://R-Forge.R-project.org", type = "source")
设置默认的CRAN网站镜像,可以通过设置repos来实现,repos选项是默认镜像的名称
例如: options(repos="https://mirrors.tuna.tsinghua.edu.cn/CRAN")
本地安装<两种--下载,然后>
1.R窗口下安装--install.packages('包文件的完整路径')
2.在命令行下(不是R窗口)直接输入:
R CMD INSTALL 包文件的完整路径
加载包
library(rjson)
require(rjson)---便于写脚本特性
查看已经加载的包
(.packages())
查看已经安装的包
installed.packages()
或者library()
查看加载的包的提供的函数----这个在查看新包的时候很有用
library(help="rjson")
help(package='rjson')
查看函数 formals() body()
清除包在环境中的作用
detach("package:rjson")
卸载包
remove. packages(c("pkg1","pkg2") , lib = file .path("path", "to", "library"))
包的状态--内存中的包,安装的包,二进制包,压缩包 以及源码包
二进制包--和平台有关--Windows下是.zip,Mac下是.tgz
压缩包---tar.gz
3.关于批量执行,自定义等设置
批处理模式,在R中有交互模式和批处理模式.介绍一下批处理模式
R语言批处理中有两种命令
R CMD BATCh
R CMD BATCh 无法简单的将命令行参数传递值脚本,以及输出必须传送到一个文件中去R CMD BATCh --quite myself.R outfile
Rscript
Rscript第命令行参数第一个是脚本文件,其余是参数, Rscript myself.R arg1 arg2
脚本内
argv <- commandArgs(TRUE)
x <- argv[1]
y <- argv[2]
加载包
require(rjson)---便于写脚本特性 library()
R语言启动
R语言启动后会首先查找有无.Rprofile文档,用户可通过编辑.Rprofile文档来自定义R启动环境,该文件可放在工作目录或安装目录中。
之后R会查找在工作目录有无.RData文档,若有的话将自动加载恢复之前的工作内容。
在R中所有的默认输入输出文件都会在工作目录中。getwd() 报告工作目录,setwd() 负责设置工作目录。在win窗口下也可以点击Change Working Directory来更改。
操作系统编码方式
关于编码--使用的操作系统的特点,操作系统所在的地区特点
例如Windows的CMD命令窗口编码方式,使用的默认语言是中文
936 (ANSI/OEM-简体中文GBK)
54936 (GB18030 简体中文)
COLLATE------校对集 monetary-----货币 NUMERIC------数字 TIME---------时间
Windows
在cmd.exe输入chcp
Linux操作系统
shell命令: locale
返回值:
LANG=zh_CN.UTF-8
LANGUAGE=zh_CN:zh
LC_CTYPE="zh_CN.UTF-8"
LC_NUMERIC="zh_CN.UTF-8"
LC_TIME="zh_CN.UTF-8"
LC_COLLATE="zh_CN.UTF-8"
LC_MONETARY="zh_CN.UTF-8"
LC_MESSAGES="zh_CN.UTF-8"
LC_PAPER="zh_CN.UTF-8"
LC_NAME="zh_CN.UTF-8"
……
R语言的编码方式
> sessionInfo()
R version 3.3.1 (2016-06-21)
Platform: x86_64-w64-mingw32/x64 (64-bit)
Running under: Windows >= 8 x64 (build 9200)
locale:
[1] LC_COLLATE=Chinese (Simplified)_China.936
[2] LC_CTYPE=Chinese (Simplified)_China.936
[3] LC_MONETARY=Chinese (Simplified)_China.936
[4] LC_NUMERIC=C
[5] LC_TIME=Chinese (Simplified)_China.936
office语言环境
在简体中文环境下,EXCEL打开的CSV文件默认是ANSI编码,
如果CSV文件的编码方式为utf-8、Unicode等编码可能就会出现文件乱码的情况。
Rstudio的安装和配置
下载安装地址:https://www.rstudio.com/products/rstudio/download/
下载安装注意事项
1.安装的路径不要有中文和空格。因为对中文的支持不是很好,而且空格会造成很多意想不到的错误。
文件的命名也类似。
2.加载包,显示安装成功,却加载不成功。
解决方式:找到安装路径,将安装包删除,然后在重新安装。
3.常规设置
<1>RSudio主题,字体,字体大小。设置下自己喜欢的背景色和字体颜色,
比方个人喜欢的。
RStudio菜单栏的Tools -> Global Options 选择General ->Appearance,Editor Theme选择一个,点击Apply,再点击OK就可以
<2>调整界面的位置
Tools -> Global Options 选择Panel Layout ->在每个位置上选择想要放置的文件,点击Apply,再点击OK就可以
修改镜像
tools->install packages
注意安装之前先改一下镜像,在tools->options->packages中修改
RStudio快捷键
<- Alt 加 _
3.中文在软件中的乱码
方案一:让程序跟随 文件的编码
读取CSV
使用
read.csv("C:/Users/yt/Desktop/sales.csv",locale = locale(encoding = "GBK")
如果使用RStudio中的命令,则如下
install.packages("readr")##只需要安装一次
library(readr)
sales <- read_csv("C:/Users/yt/Desktop/sales.csv",locale = locale(encoding = "GBK")
方案二:让改变文件的编码方式 变成和程序的编码一致
使用editplus等文本编辑器打开文本,然后将文本另存为,然后选择UTF-8的格式。
4.保存的编码说明
保存R文件使用encoding GB2312 或者UTF-8
参考:
揭开R语言中环境空间的神秘面纱 http://blog.fens.me/r-environments/