这是一个非常简单的问题,但是我有以下数据:
> head(Session_numbers)
ID Session
1 1 1_43392
2 1 1_43392
3 1 1_43392
4 1 1_43394
5 1 1_43394
6 1 1_43394
7 1 1_43398
8 1 1_43401
9 2 2_44502
10 2 2_44502
其中ID是每个主题的分组标签,并且每一行都有一个会话代码,该会话代码对应于时间点。我想对变量“ Snum”中的会话代码进行顺序编号,以便每个ID的每个相同的会话代码被分组并赋予相同的编号,例如:
ID Session Snum
1 1 1_43392 1
2 1 1_43392 1
3 1 1_43392 1
4 1 1_43394 2
5 1 1_43394 2
6 1 1_43394 2
7 1 1_43398 3
8 1 1_43401 4
9 2 2_44502 1
10 2 2_44502 1
每个ID的会话数不同,并且每个会话代码都是唯一的。
我尝试使用ave
,dplyr
和data.table
,但我似乎无法正确使用它,例如:
DT <- data.table(Session_numbers)
DT[, Snum := seq_len(.N), by = list(ID, Session)]
> head(DT)
ID Session Snum
1: 1 1_43392 1
2: 1 1_43392 2
3: 1 1_43392 3
4: 1 1_43394 1
5: 1 1_43394 2
6: 1 1_43394 3
或使用dplyr
,并使用以下代码给我一个错误消息:
> Session_numbers %>%
+ group_by(ID, Session) %>%
+ mutate(Snum = row_number())
Error: row_number() should only be called in a data context
Call `rlang::last_error()` to see a backtrace
或带有ave
head(Session_numbers)
ID Session num
1 1 1_43392 1
2 1 1_43392 2
3 1 1_43392 3
4 1 1_43394 1
5 1 1_43394 2
6 1 1_43394 3
我的问题与此类似:Count number of observations/rows per group and add result to data frame
我想念什么?
[这是一个选项,其中我们将'Session'的'ID'和match
分组,并使用'Session'的unique
元素进行分组
library(dplyr)
Session_numbers %>%
group_by(ID) %>%
mutate(num = match(Session, unique(Session)))
# A tibble: 10 x 3
# Groups: ID [2]
# ID Session num
# <int> <chr> <int>
# 1 1 1_43392 1
# 2 1 1_43392 1
# 3 1 1_43392 1
# 4 1 1_43394 2
# 5 1 1_43394 2
# 6 1 1_43394 2
# 7 1 1_43398 3
# 8 1 1_43401 4
# 9 2 2_44502 1
#10 2 2_44502 1
Session_numbers <- structure(list(ID = c(1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L),
Session = c("1_43392", "1_43392", "1_43392", "1_43394", "1_43394",
"1_43394", "1_43398", "1_43401", "2_44502", "2_44502")),
class = "data.frame", row.names = c("1",
"2", "3", "4", "5", "6", "7", "8", "9", "10"))
另一个dplyr
选项可能是:
df %>%
group_by(ID) %>%
mutate(Snum = cumsum(!duplicated(Session)))
ID Session Snum
<int> <chr> <int>
1 1 1_43392 1
2 1 1_43392 1
3 1 1_43392 1
4 1 1_43394 2
5 1 1_43394 2
6 1 1_43394 2
7 1 1_43398 3
8 1 1_43401 4
9 2 2_44502 1
10 2 2_44502 1