R语言-数据抽取（二）

2026-05-05 03:00:35

1、3）记录抽取

记录抽取函数： subset (x, condition)

x：需要处理的数据

condition：过滤条件

返回值： data.frame

案例：

items <- read.table('sales.csv', sep="|", header=TRUE, fileEncoding='utf-8', stringsAsFactors=FALSE)

sub_items <- subset(items, comments>10000) ---提取 comments大于10000的记录

2、4）随机抽样

随机抽样函数： sample (length, size, replace = FASLE)

length：样本长度

size：抽样行数

replace：是否可回收样本，默认为不放回，即FALSE

返回值：行数的位置值数组

案例：

items <- read.csv ('sales.csv') ---导入数据

rows <- nrow (items) ---数据记录行，即抽样行数length

indexes <- sample (rows, 3, replace =TRUE) ---使用 sample函数，在 rows（10行）抽取3个数据（抽取的是数据行位置行号）

data1 <- items [indexes, ] ---提取出 items表中的随机抽取出的 indexes行号对应数据

R语言-数据抽取（二）

声明：本网站引用、摘录或转载内容仅供网站访问者交流或参考，不代表本站立场，如存在版权或非法内容，请联系站长删除，联系邮箱：site.kefu@qq.com。