尽管我在stackoverflow上进行了很多搜索,但找不到我的问题的答案。这非常棘手,因为在满足3个条件的情况下,我只想比较一列中的行值。我想比较同一列(结果)中的2行值,只要且仅当它们在相同的处理,组和期间中。然后,我的目标是评估玩家1和玩家2的得分是否相同(1 =是,0 =否)。总的来说,我有五个专栏:治疗;播放器;组;结果;期。桌子下面。
df
T Player Group Result Period Same Result
1 1 6 20 1 1
1 2 6 20 1 1
1 1 5 20 1 0
1 2 1 20 1 1
1 1 1 20 1 1
1 2 2 20 1 1
1 1 2 20 1 1
1 2 4 120 1 1
1 1 3 20 1 1
1 2 3 20 1 1
1 1 4 120 1 1
1 2 5 120 1 0
2 1 2 20 1 1
2 2 1 120 1 1
2 1 4 20 1 0
2 2 5 20 1 1
2 1 6 20 1 1
2 2 2 20 1 1
2 1 3 20 1 1
2 2 3 20 1 1
2 1 1 120 1 1
2 2 6 20 1 1
2 1 5 20 1 1
2 2 4 120 1 0
有什么想法吗?帮助将不胜感激。在此先多谢!
使用tidyverse
,您可以执行以下操作。首先,group_by
您感兴趣的3栏:治疗,分组和时期。然后,对每个组使用n_distinct
,以查看该组是否只有1个唯一结果。
library(tidyverse)
df %>%
group_by(T, Group, Period) %>%
mutate(Same_Result_2 = +(n_distinct(Result) == 1))
data.table
包的替代:
library(data.table)
setDT(df)
df[, Same_Result_3 := if(uniqueN(Result)==1) 1 else 0, by=.(T, Group, Period)]
输出
Same_Result_1
是示例中提供的值。 Same_Result_2
由上述tidyverse
代码确定。
# A tibble: 24 x 7
# Groups: T, Group, Period [12]
T Player Group Result Period Same_Result_1 Same_Result_2
<int> <int> <int> <int> <int> <int> <int>
1 1 1 6 20 1 1 1
2 1 2 6 20 1 1 1
3 1 1 5 20 1 0 0
4 1 2 1 20 1 1 1
5 1 1 1 20 1 1 1
6 1 2 2 20 1 1 1
7 1 1 2 20 1 1 1
8 1 2 4 120 1 1 1
9 1 1 3 20 1 1 1
10 1 2 3 20 1 1 1
11 1 1 4 120 1 1 1
12 1 2 5 120 1 0 0
13 2 1 2 20 1 1 1
14 2 2 1 120 1 1 1
15 2 1 4 20 1 0 0
16 2 2 5 20 1 1 1
17 2 1 6 20 1 1 1
18 2 2 2 20 1 1 1
19 2 1 3 20 1 1 1
20 2 2 3 20 1 1 1
21 2 1 1 120 1 1 1
22 2 2 6 20 1 1 1
23 2 1 5 20 1 1 1
24 2 2 4 120 1 0 0