如何利用R软件进行数据探索分析?
1、运行RStudio,并输入如下代码。
#载入需要的软件包。
library(funModeling)#探索性数据分析、数据准备和模型性能评估
library(tidyverse)#数据科学集成包
library(Hmisc)#高级计算函数、绘图功能等


2、导入数据集。
#输入数据
data=data.frame(row.names=c("Zhangsan","Lisi","Wangwu","zhaoda","Bob","Tom"),
sex=c("Male","Male","Male","Female","Male","Male"),
age=c(35,43,23,57,35,28),
like=c("music","music","sport","drink","music","sport"),
score=c(90,46,87,78,69,NA))

3、查看数据的变量个数、数据类型、样本观测值等情况。
#数据概览
glimpse(data)

4、##数据清洗
df_status(data)#查看变量类型及空值情况
data=na.omit(data)#删除空值

5、分类数据分析,下列代码可以计算各分类变量每个值的频数,并绘制出直方图。
#查看分类数据的频率分布
freq(data)



6、分析数值型数据,以下代码自动识别数值型变量,进行了数据分组,并绘制频数分布直方图。
#查看数值型数据的统计数据
profiling_num(data)
#绘制数值型数据的直方图
plot_num(data,bins=3)


声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
阅读量:34
阅读量:158
阅读量:82
阅读量:154
阅读量:185