使用 LMest 评估隐马尔可夫模型(潜在转移分析)的拟合优度,评估协变量效应

问题描述 投票:0回答:1

我是一名学生,第一次尝试使用 R 中的 LMest 为我的论文进行潜在转移分析/隐马尔可夫。我正在分析在两个时间点测量的各种行为(二元变量),并对某些协变量如何影响之间的变化感兴趣时间点。 LTA 似乎适合这一点,但似乎主要是使用 Mplus 完成的。我无法访问 Mplus,而且似乎缺乏使用 LMest 的文献,所以我不知道如何实施有关正确 LTA 过程的许多建议。

  1. 评估模型拟合度,多个来源建议限制模型和/或使用似然比测试,但在这种情况下,我什至不确定将其与哪个模型进行比较。我的模型有 3 个类,那么我是否会将其与只有一个/无类的模型进行比较?或者我会使用

    modBasic = 1
    (对于“时间均匀转移矩阵”(用于限制跨波的转移概率相等),这是一些文献建议的)。这就是“测试模型的测量不变性”吗?此外,LMest 中没有计算似然比检验的选项,并且 lmtest 包不适用于 LMest 对象。我尝试手动计算,但 p 值为 0,这对我来说似乎是错误的。在我看来,仅使用 BIC/AIC 不足以评估模型。更多文献(Bartolucci et al., 2009. DOI:10.1214/08-AOAS230, Bartolucci et al., 2014, https://doi.org/10.1007/s11749-014-0381-7)也建议使用 R-平方和熵来评估拟合度,虽然 Mplus 似乎确实有这些,但 LMest 没有(并且在他们的 R 文档中也没有真正提到评估拟合度)。那么我如何评估我的模型在 LMest 中的拟合度并将其与其他模型进行比较?

  2. 我在模型中包含了可能影响转移概率的协变量,但我无法理解如何解释输出。我复制了下面的输出。

Ga - Parameters affecting the logit for the transition probabilities:
, , logit = 1

           logit
                  2       3
  intercept -1.7821 -2.8981
  X1gender   0.2112  0.7080

, , logit = 2

           logit
                  2       3
  intercept -1.4892 -2.7488
  X1gender   0.2025  0.0134

, , logit = 3

           logit
                  2       3
  intercept -0.6304 -1.4776
  X1gender   0.0084  0.5398

出于测试目的,到目前为止我只包含一个协变量,但最终将包含更多协变量。 我假设 logit = 1, 2, 3 指的是类别,但在这种情况下,为什么结果只指 2/3 而不是 1?

此外,我如何知道协变量的影响是否显着?我假设显示的数字是对数赔率,因为它是多项 Logit 回归? LMest 似乎也没有包含这方面的进一步统计数据。使用 R 中的基本多 Logit 回归模型,我可以通过使用

tidy(model)
等获得更多信息,例如检验统计量、p 值、置信区间,并且我可以使用其他软件包轻松计算边际效应。在这种情况下,由于我无法使用 LMest 对象的标准包,我该怎么做?我在这里遗漏了一些东西还是我必须手动完成所有事情?我对协变量对转移概率的影响特别感兴趣。

预先感谢您的帮助

r logistic-regression hidden-markov-models longitudinal goodness-of-fit
1个回答
0
投票

您问了三个不同的问题,我将重点关注最后两个问题(因为我不确定在具有二元结果的隐马尔可夫模型中执行模型检查的最佳方法是什么)。

转移概率参数

LMest 输出 12 个参数的原因是转移概率矩阵的行被限制为总和为 1。例如,如果我们知道

Pr(1 -> 2)
Pr(1 -> 3)
,我们可以计算
Pr(1 -> 1) = 1 - Pr(1 -> 2) - Pr(1 -> 3)
。这意味着,在具有 k 个状态的模型中,LMest 只需要估计 k*(k-1) 个转移概率。在您的情况下,k = 3,因此需要估计 6 个转移概率。对于每一个,LMest 都会估计您所包含的协变量 (X1Gender) 的截距和斜率。如果包含更多协变量,就会有更多参数。

标准误差

为了评估协变量和转移概率之间是否存在明显关联(即“统计显着性”),一种选择是使用 LMest 计算的标准误差。如果您在

out_se = TRUE
中指定参数
lmest()
,则模型对象将有一个名为
seGa
的术语。这为您提供了
Ga
中每个参数的标准误差。使用最大似然估计量的大样本近似正态性,您可以使用类似的方法获得 95% 的置信区间

# Lower bound
low <- mod$Ga - 1.96 * mod$seGa
# Upper bound
upp <- mod$Ga + 1.96 * mod$seGa

其中

mod
lmest()
的输出。然后,您可以检查感兴趣参数的置信区间是否与零重叠。

© www.soinside.com 2019 - 2024. All rights reserved.