计算重复数量 - 替代plyr包

问题描述 投票:0回答:2

我有兴趣计算我的数据中的重复数,所以我可以证明使用kendall的tau来计算我的变量之间的相关系数。以下命令正是我想要的:

ddply(df,.(a,b ),nrow) # plyr package

然而,问题在于plyr包。安装完成后,我在运行ggplot命令时出错。

这是我在会话中安装的软件包列表。我试过重启会话,没用。

packages(c("dplyr", "tidyr", "data.table", "ggplot2", "readxl", "magrittr", "tidyverse",
           "ggpubr", "forcats", "car", "PerformanceAnalytics", "mtcars", "Hmisc", "gplots",
           "nortest", "dunn.test", "psych", "FSA", "DescTools"))

我认为plyr包会以某种方式干扰我的其他包。

我怎么解决这个问题 ?

要么

是否有替代ddply命令的解决方案?

r ggplot2 duplicates plyr
2个回答
1
投票

这是一种使用基数R计算重复数量的方法:

set.seed(111)
mydata <- sample(1:100, 100, 1)
(nDuplicates <- length(mydata) - length(unique(mydata)))

> (nDuplicates <- length(mydata) - length(unique(mydata)))
[1] 35

1
投票

由于你加载了dplyr,这里是一个使用mtcars的dplyr方法作为例子:

dups <- mtcars %>%
      group_by(cyl) %>%
      summarize(n()) %>%
      print
© www.soinside.com 2019 - 2024. All rights reserved.