我有兴趣计算我的数据中的重复数,所以我可以证明使用kendall的tau来计算我的变量之间的相关系数。以下命令正是我想要的:
ddply(df,.(a,b ),nrow) # plyr package
然而,问题在于plyr
包。安装完成后,我在运行ggplot
命令时出错。
这是我在会话中安装的软件包列表。我试过重启会话,没用。
packages(c("dplyr", "tidyr", "data.table", "ggplot2", "readxl", "magrittr", "tidyverse",
"ggpubr", "forcats", "car", "PerformanceAnalytics", "mtcars", "Hmisc", "gplots",
"nortest", "dunn.test", "psych", "FSA", "DescTools"))
我认为plyr
包会以某种方式干扰我的其他包。
我怎么解决这个问题 ?
要么
是否有替代ddply
命令的解决方案?
这是一种使用基数R计算重复数量的方法:
set.seed(111)
mydata <- sample(1:100, 100, 1)
(nDuplicates <- length(mydata) - length(unique(mydata)))
> (nDuplicates <- length(mydata) - length(unique(mydata)))
[1] 35
由于你加载了dplyr,这里是一个使用mtcars的dplyr方法作为例子:
dups <- mtcars %>%
group_by(cyl) %>%
summarize(n()) %>%
print