如果两次之间如何从另一个表返回值?

问题描述 投票:0回答:1

我有一个数据集,用于查看发生特定“运行”的时间。这是数据集的head()。

time <- c(15:27.7, 15:27.7, 15:27.8, 15:27.9, 15:28.0) 

我希望返回一个“运行编号”,如果时间值在数据帧中的某个时间之间,它将返回相应的运行。 “查找”表如下。

START   END       Run
  <fct>   <fct>   <int>
1 15:27.7 15:29.1     1
2 20:32.3 20:37.3     2
3 25:57.3 25:58.7     3
4 17:53.8 17:54.0     4

我想要的运行结果应该是:

  TIME     Run
1 15:27.7   1
2 15:27.7   1
3 15:27.8   1
4 15:27.9   1
5 15:28.0   1

我相信我可能需要更改时间的格式,但也不确定如何执行此操作。

任何帮助将不胜感激。

r format lookup between
1个回答
1
投票

是-您必须将所有看起来像查找表中因素的“时间”转换为日期/时间或“ POSIXct”类对象,以便随后可以查找值。 as.POSIXct功能可以为您执行此操作。

df$time2 <- as.POSIXct(df$time, format="%M:%OS")
lkup$START <- as.POSIXct(lkup$START, format="%M:%OS")
lkup$END <- as.POSIXct(lkup$END, format="%M:%OS")

然后使用多种方法之一,根据主数据帧中的时间值从查找表中查找运行值。在这里,我将使用数据表的非等价联接,因为它相当简单。

library(data.table)
setDT(lkup)[setDT(df), on=.(START<=time2, END>=time2), .(id, time, Run)]
   id    time Run
1:  1 15:27.7   1
2:  2 15:29.1   1
3:  3 20:32.3   2
4:  4 25:58.7   3
5:  5 17:53.9   4

数据

df <- structure(list(id = 1:5, time = c("15:27.7", "15:29.1", "20:32.3", 
"25:58.7", "17:53.9")), class = "data.frame", row.names = c(NA, 
-5L))

  id    time
1  1 15:27.7
2  2 15:29.1
3  3 20:32.3
4  4 25:58.7
5  5 17:53.9 

lkup <- structure(list(START = c("15:27.7", "20:32.3", "25:57.3", "17:53.8"
), END = c("15:29.1", "20:37.3", "25:58.7", "17:54.0"), Run = 1:4), class = "data.frame", row.names = c("1", 
"2", "3", "4"))

    START     END Run
1 15:27.7 15:29.1   1
2 20:32.3 20:37.3   2
3 25:57.3 25:58.7   3
4 17:53.8 17:54.0   4
© www.soinside.com 2019 - 2024. All rights reserved.