我在为大型数据框创建子集时遇到麻烦。我需要提取与其中一列中两个正确的城市之一匹配的所有行,但是我创建的任何子集最终都为空。给定主要数据框,我尝试:
New = data[data$Home.port %in% c("ARDGLASS","NEWLYN")]
但是R返回“选择的未定义列”
缺少逗号:
New = data[data$Home.port %in% c("ARDGLASS","NEWLYN"), ]
这是因为您选择的是行而不是列;如果省略逗号,则R
尝试将列而不是行子集。
我建议这样使用data.table:
# install.packages(data.table)
library(data.table)
data <- as.data.table(data)
new_data <- data[Home.port %in% c("ARDGLASS","NEWLYN")]
您可以检查this web来学习数据。有了大数据库,表就非常快了