R语言基础:展示数据分布

2025-09-27 05:26:13

1、首先我们引入一个大数据集

R语言基础:展示数据分布

2、对于一维连续型分布,最重要的几何对象是直方图 geom_histogram。

例如,展示diomands数据集中的depth变量

R语言基础:展示数据分布

R语言基础:展示数据分布

3、如果你想展示更多组间信息,那你可以使用下面的几种参数,

按照cut变量的不同取值进行线条的上

R语言基础:展示数据分布

R语言基础:展示数据分布

R语言基础:展示数据分布

4、按照cut变量的不同取值进行填充柱状图

R语言基础:展示数据分布

R语言基础:展示数据分布

5、geom_density 一维密度曲线图:

如果不设置其他参数,实际上就是直方图的平滑曲线版本,无法回溯数据本身,意义不大

R语言基础:展示数据分布

R语言基础:展示数据分布

6、如果用cut变量的不同取值进行上色,就会得到一个信息量更大的版本

R语言基础:展示数据分布

R语言基础:展示数据分布

7、如果想比较两个变量之间的关系,那就需要使用其他函数,诸如

geom_boxplot:箱型图,也称箱须图

横轴取值是离散型变量时:

R语言基础:展示数据分布

R语言基础:展示数据分布

8、横轴取值是连续型变量时,用cut_width设置离散区间,用xlim设置横轴取值范围

R语言基础:展示数据分布

R语言基础:展示数据分布

9、横轴取值是离散型变量时

R语言基础:展示数据分布

R语言基础:展示数据分布

R语言基础:展示数据分布

声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
猜你喜欢