R 生存分析:coxph - 包括时间为零的个体

问题描述 投票:0回答:1

我有一个理论问题,想知道是否有人可以向我解释这一点。 我目前正在 R 中使用命令 coxph 对我的数据集执行生存分析。然而,我遇到了一个关于 R 如何处理零失败时间的问题。

在我的数据集中,我的患者随访时间为零 (t=0),并注意到 R 命令 coxph 在执行 cox 比例风险模型时并未排除这些患者。这些患者从一开始就包含在风险集中,并且似乎对该模型的输出做出了贡献。此外,当排除这些患者并随后执行 cox PH 模型时,β 系数会返回不同的结果。

我很好奇为什么这些人被包括在内,以及当 t=0 时 coxph 命令如何执行此类分析,并且想知道是否有人可以澄清这一点。

我用一个小的测试数据集进行了尝试,得到了两个不同的结果。

id <- c(1:10)
event <- c(0,0,0,0,0,1,1,1,1,1)
time <- c(1, 2, 3, 4, 0, 1, 2, 3, 0, 0)
age <- c(30, 40, 22, 25, 60, 30, 40, 22, 25, 60)

test <- data.frame(id, event, time, age, stringsAsFactors=FALSE)

test.cox <- coxph(Surv(time, event)~age, data=test)
test.cox 

    Call:
    coxph(formula = Surv(time, event) ~ age, data = test)

            coef exp(coef) se(coef)     z    p
    age 0.04393   1.04491  0.04151 1.058 0.29

    Likelihood ratio test=1.1  on 1 df, p=0.2937
    n= 10, number of events= 5 


# Remove patients with follow up time is zero
test_min0 <- test[test$time!=0,]
test.cox_min0 <- coxph(Surv(time, event)~age, data=test_min0)
test.cox_min0

      Call:
      coxph(formula = Surv(time, event) ~ age, data = test_min0)

      coef exp(coef) se(coef)     z     p
      age 0.07575   1.07870  0.09487 0.798 0.425

      Likelihood ratio test=0.7  on 1 df, p=0.4042
      n= 7, number of events= 3 
r survival-analysis cox-regression
1个回答
0
投票

在生存分析中,零时间(t=0)通常代表研究的开始或个体进入研究的时间点。包括 t=0 的个体意味着承认他们在进入研究的那一刻就面临着该事件的风险,即使该事件或审查立即发生。

t=0 的患者可能在进入研究后立即经历了感兴趣的事件。这种纳入提供了整个研究人群的风险状况的更完整的图景,确保早期事件不被忽视。

风险集贡献:即使是随访时间很短的个体也会对 t=0 时的风险集做出贡献。这可能会影响基线风险函数和模型中协变量系数的估计。

当coxph函数遇到t=0时,这些个体在研究一开始就被认为处于危险之中。它们对风险集做出贡献,如果他们经历了事件,则对 t=0 时的风险比的计算做出贡献。

t=0 的个体的存在会影响回归系数 (β) 的估计,因为它们改变了时间尺度开始时风险集的组成。这可能会导致协变量的估计风险比和显着性水平存在差异。

排除 t=0 的患者可能会导致不同的 β 系数,因为 t=0 时设置的风险发生变化,从而改变基线风险和与协变量相关的相对风险估计。

了解纳入或排除这些个体的临床和统计意义至关重要。对于某些分析来说,将它们包括在内可以更全面地代表人群风险。在其他情况下,排除可能是合理的,特别是当 t=0 表示数据输入或测量错误时。

如果 t=0 个体的存在不是由于数据错误,而是反映了真实的即时事件或研究进入标准,那么从方法学和临床角度来看,将其纳入通常是合理的。然而,执行敏感性分析(例如,有或没有这些人)以了解此类决策对模型结果的影响始终很重要。

© www.soinside.com 2019 - 2024. All rights reserved.