首先,全面披露。我尝试在具有相关子查询的MS Access中严格执行此操作,并在此帖子12 month moving average by person, date上提供了一些帮助。我原本以为我的数据足够小,可以通过,但很糟糕。作为替代方案,我将尝试在R中运行它,然后将结果写入MS Access中的新表。我有数据,以便我有以下字段:
rep, cyc_date, amt
继Andrie连续5年(相对于5年平均值)R: Calculating 5 year averages in panel data的相关示例之后,我试图通过amt
将rep
场的12个月平均值推高。这是我的代码:
library(zoo)
library(plyr)
library(RODBC)
# Pull data from local MS Access database. The referenced sqlFetch is a query
# that pulls the data, ordered by `rep`, then `cyc_date`
channel <- odbcConnectAccess2007("C://MyDB.accdb")
data <- data.frame(sqlFetch(channel, "MyView"))
# Ensure coercion of `cyc_date` to date type
data$cyc_date <- as.Date(data$cyc_date)
# Function (take from post above)
rollmean12 <- function(x) {
rollmean(x, 12)
}
# Calculate rolling average by person
rollvec <- ddply(data, .(data$rep), rollmean12(data$amt))
不幸的是,这不起作用。我收到以下错误:
Error in llply(.data = .data, .fun = .fun, ..., .progress = .progress, :
.fun is not a function.
我不确定为什么会这样。我是否需要将data
显式转换为zoo
对象?如果是这样,不确定如何处理由person_id
字段产生的额外维度。任何帮助将非常感谢。
我在以下帖子中找到了这段代码:applying rolling mean by group in R
data$movavg <- ave(data$amt, data$rep, FUN = function(x) rollmean(x, k=12, align="right", na.pad=T)).
ave
拯救了这一天!
只是一些提示,因为我根本不使用时间序列:ddply
需要数据帧输入,所以不要将其转换为zoo
对象。 .(data$rep)
我认为应该只是.(rep)
,并且rollmean12
不应该用参数调用。相反,您应该重新编写函数以提取所需的列。所以,大概是这样的:
rollmean12 <- function(x) rollmean(x$amt, 12)
如果您执行?ddply
,则可以链接到JSS中非常有用的出版物。
试试tidyquant
图书馆
x %>% tq_mutate(
# tq_mutate args
select = amt,
mutate_fun = rollapply,
col_rename = "rollmean12", ####
# rollapply args
width = 12,
align = "right",
FUN = mean,
# mean args
na.rm = TRUE
)