我有一组通过RFID读取器的动物数据集,看起来像这样-
ID date_time
A 2019-11-02 08:07:47
B 2019-11-02 08:07:48
A 2019-11-02 08:07:49
A 2019-11-02 08:07:50
A 2019-11-02 08:09:12
A 2019-11-02 08:09:13
B 2019-11-02 08:09:17
我最近问了这个问题,(combine multiple rows into one time interval),现在我的数据看起来像这样-(数据分为十秒的间隔)
ID start_date_time. end_date_time
A 2019-11-02 08:07:47 2019-11-02 08:07:50
B 2019-11-02 08:07:48 2019-11-02 08:07:48
A 2019-11-02 08:09:12 2019-11-02 08:09:13
B 2019-11-02 08:09:17 2019-11-02 08:09:47
我还添加了一个汇总间隔的列
dat$Interval = interval(dat$start_date_time,dat$end_date_time)
我现在需要找到并总结这些间隔在何处相交,并将其作为计数,以显示动物互动(或同时出现在RFID阅读器上)的次数-(并且无需重复反向交互,即A-B,B-A)
ID ID2 Interactions(n)
A A 0
A B 1
A C 3
任何帮助表示赞赏。
这个问题很难回答。也许这可能是一个很好的起点:
library(tidyverse)
library(lubridate)
cbind(
dat[rep(1:nrow(dat[-1, ]), nrow(dat[-1, ]):1), c(1, 4)],
setNames(
dat[unlist(sapply(2:nrow(dat), seq, to = nrow(dat))), c(1, 4)],
c('ID2', 'Interval2')
)
) %>%
mutate(
interacts = intersect(Interval, Interval2),
Interval = NULL,
Interval2 = NULL
) %>%
filter(!is.na(as.numeric(interacts))) %>%
count(ID, ID2)
# # A tibble: 1 x 3
# ID ID2 n
# <chr> <chr> <int>
# 1 A B 1