如何根据面板数据集中的某个值计算行数？

Question

我正在处理像df这样的面板数据。所以我有一个独特的UserID（Uid），一个TimeVariable（TV）和我感兴趣的主要变量（MV，虚拟编码）。每行代表一个独特的UiD电视组合。现在我想创建一个新的变量（NV），它基本上计算直到电视时间发生的事件数（MV = 1）。

内容：我想要一个计数变量（NV），它基本上计算每个时刻事件MV = 1发生到那个时刻（TV）的频率。

到目前为止，我只能设法根据UserId对其进行总结，但不会将其提升到越来越高的水平。

What I managed so far:

df <- df %>% group_by(user_id) %>% mutate(NV=count_if(1,MV))

结果以MV的每个用户ID的聚合为基础给出

所以df看起来像：

到目前为止我的代码的结果是：

UI TV MV NV
1  1  0  1
1  2  1  1
1  3  0  1
2  1  0  2
2  2  0  2
2  3  1  2
2  4  2  2
3  1  1  3
3  2  0  3
3  3  1  3
3  4  1  3

我真正想要的是：

UI TV MV NV
1  1  0  0
1  2  1  1
1  3  0  1
2  1  0  0
2  2  0  0
2  3  1  1
2  4  2  2
3  1  1  1
3  2  0  1
3  3  1  2
3  4  1  3

非常感谢您的帮助！

Answer 1

我们可以group_by UI并采取MV == 1的累积总和

library(dplyr)

df %>%
  group_by(UI) %>%
  mutate(NV = cumsum(MV == 1))


#      UI    TV    MV    NV
#   <int> <int> <int> <int>
# 1     1     1     0     0
# 2     1     2     1     1
# 3     1     3     0     1
# 4     2     1     0     0
# 5     2     2     0     0
# 6     2     3     1     1
# 7     2     4     2     1
# 8     3     1     1     1
# 9     3     2     0     1
#10     3     3     1     2
#11     3     4     1     3

在基地R，我们可以使用ave

with(df, ave(MV == 1, UI, FUN = cumsum))
#[1] 0 1 1 0 0 1 1 1 1 2 3

数据

df <- structure(list(UI = c(1L, 1L, 1L, 2L, 2L, 2L, 2L, 3L, 3L, 3L, 
3L), TV = c(1L, 2L, 3L, 1L, 2L, 3L, 4L, 1L, 2L, 3L, 4L), MV = c(0L, 
1L, 0L, 0L, 0L, 1L, 2L, 1L, 0L, 1L, 1L)), class = "data.frame", 
row.names = c(NA, 
-11L))

如何根据面板数据集中的某个值计算行数？

问题描述投票：0回答：1

What I managed so far:

1个回答

最新问题

如何根据面板数据集中的某个值计算行数？

问题描述 投票：0回答：1

What I managed so far:

1个回答

最新问题

问题描述投票：0回答：1