滚动时间序列

问题描述 投票:10回答:2

[我正在尝试计算20个周期的历史波动率。我拿每日收益:

ret<-ROC(data1)

然后我使用rollapply获取每列20天的HV:

vol<-rollapply(ret,20,sd,by.column=T,fill=NA)

问题是vol的观测值在十天后开始出现,这与我指定的20错误。

为了演示,这里是数据示例:

0.000000000, 0.005277045, 0.023622047, 0.002564103,-0.002557545, -0.020512821,
0.007853403,-0.012987013,  0.007894737,  0.015665796,  0.000000000, -0.002570694,
0.002577320, -0.015424165, 0.002610966,  0.010416667,  0.002577320,  0.015424165, 
0.000000000, -0.002531646, -0.002538071, 0.030534351,  0.014814815, -0.007299270,
-0.009803922, -0.012376238,  0.002506266, -0.015000000,-0.002538071,  0.002544529

假设上面的数据存储在x中,然后:

rollapply(x,20,sd,fill=NA)

将在第10行产生第一个观察值,而不是20。而且sd也是错误的。

我应该在这里丢失一些东西...

r zoo
2个回答
23
投票

您需要使用align='right'而不是默认的align='center',或代替rollapply,使用具有rollapplyr作为默认值的align='right'包装器。

来自?rollapply

对齐指定结果的索引与观察的滚动窗口相比是左对齐还是右对齐或居中(默认)。仅当width表示宽度时才使用此参数。

尽管如此,就我个人而言,我会使用runSD包中的TTR,因为它使用编译后的代码,并且会更快。

其中任何一个都可以达到您的期望,但是第二个会更快。

library(zoo)
rollapply(x, 20, sd, fill=NA, align='right')

library(TTR)
runSD(x, 20)

0
投票

我建议使用runner包中的runner函数在滚动窗口上应用任何R函数。 runner以下的输出与zoo相同。

library(runner)

runner(
  x, 
  function(x) sd(x),
  k = 20, 
  na_pad = TRUE
)


[runner可以再现zoo的输出,并且还具有处理不等间距数据和其他选项的选项(有关更多信息,请转到documentation and vignettes)。

library(runner)
library(zoo)

x <- c(0.000000000, 0.005277045, 0.023622047, 0.002564103,-0.002557545, -0.020512821,
       0.007853403,-0.012987013,  0.007894737,  0.015665796,  0.000000000, -0.002570694,
       0.002577320, -0.015424165, 0.002610966,  0.010416667,  0.002577320,  0.015424165, 
       0.000000000, -0.002531646, -0.002538071, 0.030534351,  0.014814815, -0.007299270,
       -0.009803922, -0.012376238,  0.002506266, -0.015000000,-0.002538071,  0.002544529)

identical(
  runner(x, sd, k = 20, na_pad = TRUE),
  rollapply(x, 20, sd, fill = NA, align = "right")
)

# centered alignment
identical(
  runner(x, sd, k = 20, lag = -10, na_pad = TRUE),
  rollapply(x, 20, sd, fill = NA, align = "center")
)
© www.soinside.com 2019 - 2024. All rights reserved.