计算滞后/前导变化的向量中元素的差

Question

我有一些实验室数据，我希望计算在移动时间范围/窗口（例如2分钟（分别设置为0-2、2-4、4-6分钟，静态窗口）内）的样品测量之间的差异。问题是，尽管每秒对数据进行一次采样，但仍有一些样本丢失（例如1,2,4,6,7），因此我不能使用固定滞后函数，尤其是对于较大的时间窗口。

这里是我尝试过的最有希望的。我试图计算行位置的差，然后将其用于确定滞后值。

library(tidyverse)

df <- data.frame(sample_group = c(rep("a", 25), rep("b", 25)),t_seconds = c(1:50), measurement = seq(1,100,2))
df <- df[-c(5,10,23,33,44),] #remove samples

t_window = 5 

df_diff <- df %>%
  group_by(sample_group) %>%
  arrange(t_seconds) %>%
      mutate(lag_row = min(which(t_seconds >= t_seconds + t_window))- min(which(t_seconds == t_seconds)), #attempt to identify the lag value for each element 
             Meas_diff = measurement - lag(measurement, lag_row))

在此示例中（lag_row），我试图从向量和向量本身中调用一个元素，这显然不起作用！为了更清楚一点，我添加了“ _v”以标识我想要的矢量，并将“ _e”标识为该矢量的元素min(which(t_seconds_v >= t_seconds_e + t_window))- min(which(t_seconds_v == t_seconds_e))

我试图避免使用循环，但未能解决问题。如果有人有更好的主意，我将不胜感激。

Answer 1

您的第一步应该是在时间序列中插入缺失的观测值。然后，您可以使用Last-Observation-Carried-Backwards操作填充缺少的值。这为您提供了完整的常规时间序列。

您所需的输出是非常不清楚的，因此在下面的示例中，下一步仅是猜测。根据需要进行调整。

#complete time series (using a data.table join):
library(data.table)
setDT(df)
df_fill <- df[, .SD[data.table(t_seconds = min(t_seconds):max(t_seconds)), 
                    on = "t_seconds"], 
              by = sample_group]
df_fill[, filled := is.na(measurement)]

#last observation carried backwards
library(zoo)
df_fill[, measurement := na.locf(measurement, fromLast = TRUE), by = sample_group]

#differences
df_fill[, diff_value := shift(measurement, -t_window) - measurement, by = sample_group]

计算滞后/前导变化的向量中元素的差

问题描述投票：0回答：1

1个回答

最新问题

计算滞后/前导变化的向量中元素的差

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1