“生命线”中的Cox PH模型 - 违反虚拟变量的假设

问题描述 投票:1回答:1

我正在使用lifelines库来估计Cox PH模型。对于回归,我有许多分类特征,我对每个特征进行热编码并删除一列以避免多重共线性问题(虚拟变量陷阱)。我没有附加代码,因为示例可能与文档here中给出的类似。

通过运行cph.check_assumptions(data),我收到每个虚拟变量违反假设的信息:

Variable 'dummy_a' failed the non-proportional test: p-value is 0.0063.
Advice: with so few unique values (only 2), you can try `strata=['dummy_a']` in the call in `.fit`. See documentation in link [A] and [B] below.

对于单个分类特征,我应该如何理解多个虚拟变量的建议?我应该把他们全部添加到阶层吗?

我会感激任何评论:)

python survival-analysis cox-regression lifelines
1个回答
1
投票

@abu,你的问题在文档中提出了明显的差距 - 如果虚拟变量违反比例测试该怎么办。在这种情况下,我建议不要贬低变量,并将原始列添加为分层变量,例如:fit(..., strata=['dummy'])

© www.soinside.com 2019 - 2024. All rights reserved.