我想使用 Kaplan Meier 模型收集有关
sales
数据的一些基本统计数据。我的数据是长格式的,每个观察到的单位在市场上的每一天都有一个单独的行,就像这样:
id date time_on_market sold
1 2022-01-01 0 0
1 2022-01-02 1 0
1 2022-01-03 2 1
2 2022-02-14 0 0
2 2022-02-15 1 1
有没有办法在不将数据转换为宽格式的情况下做到这一点?
我之前在宽幅数据的时候用KM做过生存曲线,例如:
id date time_on_market sold
1 2022-01-03 2 1
2 2022-02-15 1 1
3 2022-03-30 30 0
每一行都是一个独特的观察,总上市时间,以及是否售出的虚拟变量,但我似乎无法弄清楚文档在数据很长时创建正确类型的对象。如果我只是尝试使用
创建曲线pacman::p_load(survival, ggsurvfit, gtsummary, tidycmprsk, survminer)
survfit2(Surv(time_on_market, sold) ~ 1, data = sales) %>%
ggsurvfit()
结果曲线不正确。
任何帮助表示赞赏!!