最终,我希望绘制随着更多观察结果添加到数据集中各种统计属性的变化(收敛到真实值),并在数据的一系列随机排列上迭代地执行此操作。我想使用 PerformanceAnalytics 中的
apply.fromstart
来随着数据集的增长生成不断变化的统计数据。
我的数据集如下所示:
qpcr_a100p.z <-
structure(c(115.3, 108.4, 112.8, 101, 107.6, 84.9, 87.7, 94.7,
108.3, 107.3, 115, 79.1, 70.1, 61, 125.5, 111.1, 67.7, 119.4,
85.5, 109.3, 68.5, 98.3, 71.8, 81.6, 96, 140.8, 75.3, 83.6, 90.6,
107.5), index = c(30, 94, 103, 104, 114, 120, 155, 234, 240,
272, 289, 314, 439, 492, 502, 544, 547, 557, 564, 592, 656, 775,
783, 803, 805, 855, 856, 870, 929, 985), class = "zoo")
但是,当我尝试运行时出现错误
apply.fromstart
:
> library(PerformanceAnalytics)
> apply.fromstart(qpcr_a100p.z, FUN = "mean", gap = 1)
Error in 1:columns : argument of length 0
我尝试了
apply.fromstart
命令的一些变体,包括:
> apply.fromstart(qpcr_a100p.z[,1,drop=FALSE], FUN = "mean", gap = 1)
但我仍然遇到同样的错误。
很明显,函数
apply.fromstart
中存在数据类型不匹配(我认为问题在于变量的时间)。如果您的动物园对象名为 qpcr_a100p.z
,我建议使用以下解决方法:
dat=na.omit(as.xts(as.ts(qpcr_a100p.z)))
apply.fromstart(dat, FUN = "mean", gap = 1)
它产生以下结果:
> as.numeric(apply.fromstart(dat, FUN="mean", gap=1))
[1] 115.30000 111.85000 112.16667 109.37500 109.02000 105.00000 102.52857
[8] 101.55000 102.30000 102.80000 103.90909 101.84167 99.40000 96.65714
[15] 98.58000 99.36250 97.50000 98.71667 98.02105 98.58500 97.15238
[22] 97.20455 96.10000 95.49583 95.51600 97.25769 96.44444 95.98571
[29] 95.80000 96.19000
错误是因为您的
qpcr_a100p.z
动物园对象没有 dim
属性,因此从技术上讲它没有任何列。此外,apply.fromstart
期望有一个基于时间的索引。
所以设置
dim
s并将索引转换为Date,函数就可以工作了。
dim(qpcr_a100p.z) <- c(NROW(qpcr_a100p.z),NCOL(qpcr_a100p.z))
index(qpcr_a100p.z) <- as.Date(index(qpcr_a100p.z), origin="1970-01-01")
out <- apply.fromstart(qpcr_a100p.z, FUN = "mean", gap = 1)
# convert the index back to numeric, if necessary
index(out) <- as.numeric(index(out))