R数据可视化手册「pdf+epub+mobi+txt+azw3」

3_看图王.jpg

R数据可视化手册电子书简介:

R具有强大的统计计算功能和便捷的数据可视化系统。《R数据可视化手册》重点讲解R的绘图系统,指导读者通过绘图系统实现数据可视化。

书中提供了快速绘制高质量图形的150多种技巧,每个技巧用来解决一个特定的绘图需求。读者可以通过目录快速定位到自己遇到的问题,查阅相应的解决方案。同时,作者在大部分的技巧之后会进行一些讨论和延伸,介绍一些总结出的绘图技巧。

《R数据可视化手册》侧重于解决具体问题,是R数据可视化的实战秘籍。《R数据可视化手册》中绝大多数的绘图案例都是以强大、灵活制图而著称的R包ggplot2实现的,充分展现了ggplot2生动、翔实的一面。从如何画点图、线图、柱状图,到如何添加注解、修改坐标轴和图例,再到分面的使用和颜色的选取等,本书都有清晰的讲解。虽然本书的大多数技巧使用的是ggplot2,但是并不仅仅局限于ggplot2的介绍。作者的理念是用合适的工具来完成合适的绘图任务,读者也可以学到许多其他有用的绘图函数和工具,来适应各种复杂的需求。

R数据可视化手册电子书内容:

基于分组数据绘制分组密度曲线

问题

如何基于分组数据绘制分组密度曲线?

方法

使用geom_density()函数,将分组变量映射给colour或fill等图形属性即可,如图6-11所示。分组变量必须是因子型或者字符串向量。数据集birthwt对应的最佳分组变量smoke被存储为数值型,所以,我们必须先将其转化为因子:

library(MASS) # 为了使用数据

# 复制数据的副本

birthwt1 <- birthwt

# 把变量smoke转化为因子

birthwt1$smoke <- factor(birthwt1$smoke)

# 把变量smoke映射给colour

ggplot(birthwt1, aes(x=bwt, colour=smoke)) + geom_density()

# 把变量smoke映射给fill,设置alpha使填充色半透明

ggplot(birthwt1, aes(x=bwt, fill=smoke)) + geom_density(alpha=.3)

图6-11 左图:每组数据对应于不同的线条颜色 右图:每组数据对应于不同的半透明填充色

讨论

绘制上图时,要求所有用到的数据都包含在一个数据框里,且数据框的其中一列是可用于分组的分类变量。

这里以birthwt数据集为例。该数据集包含的是关于婴儿出生体重及一系列导致出生体重过低的危险因子的数据:

birthwt

low age lwt race smoke ptl ht ui ftv bwt

 0 19 182  2   0  0 0 1  0 2523

 0 33 155  3   0  0 0 0  3 2551

 0 20 105  1   1  0 0 0  1 2557

...

观察一下变量smoke(抽烟与否)与变量bwt(出生体重,单位是克)的关系。变量smoke对应的取值是0和1,但由于其被存储为数值型向量,因而ggplot()函数不知道应当将其作为分类变量来处理。这时有两种方法可以选择,一是将数据框中相应的列转化为因子,二是通过在aes()函数内部使用命令factor(smoke)来告诉ggplot()函数把smoke当作因子来处理。本例中,我们将其转化为因子。

R数据可视化手册「pdf+epub+mobi+txt+azw3」下载

声明:

推书365展示内容收集于网络,仅用于免费的知识分享交流和学习!版权归出版方所有。

如有侵权,请联系本站进行删除,感谢您的理解与包容!

如果您喜欢本站推荐书籍等资源,请支持购买正版,谢谢合作!