我在tmp目录中有一个.stat文件列表。
样本:
a.stat =>
abc,10
abc,20
abc,30
b.stat =>
xyz,10
xyz,30
xyz,70
依此类推
我需要找到所有.stat文件的摘要。目前我正在使用filelist<-list.files(path="/tmp/",pattern=".stat")
data<-sapply(paste("/tmp/",filelist,sep=''), read.csv, header=FALSE)
但是我需要对正在读取的所有文件应用摘要。或者只是在n个.stat文件中,我需要第二列的摘要[]
使用
[data<-sapply(paste("/tmp/",filelist,sep=''), summary, read.csv, header=FALSE)
不起作用,并给我带有类字符的摘要,这不是我想要的。
sapply(filelist, function(filename){df <- read.csv(filename, header=F);print(summary(df[,2]))})
正常工作。但是,我的总体目标是找到两边(异常值)相差超过2个标准偏差的值。因此,我使用sd,但同时需要检查当前读取的文件中的所有值是否都在2SD范围内。
我在tmp目录中有一个.stat文件列表。样本:a.stat => abc,10 abc,20 abc,30 b.stat => xyz,10 xyz,30 xyz,70等等,我需要找到所有.stat文件的摘要。目前我正在使用...
一次应用多个功能:
添加到@Jangorecki,我更改了功能,使其包含向量而不是列表。只有这样,它对我有用。我不确定为什么我的功能能正常工作,而不是其他。