随机森林生存分析崩溃

问题描述 投票:1回答:2

我正在尝试在6500记录数据帧上运行RFSRC,包含59个变量:

rfsrc_test <- rfsrc(Surv(TIME, DIED) ~ ., data=test, nsplit=10, na.action = "na.impute")

当我在1500条记录上运行它时,它似乎有效,但在整个数据集上崩溃了。 它在没有任何特定错误的情况下崩溃R - 有时会出现“异常处理错误”。 有什么想法如何调试这个?我没有任何运气地浏览数据库中的奇怪行。

r random-forest survival-analysis
2个回答
0
投票

您可以检查的一件事是时间变量 - 存在多少个不同的值?生存林将为每个节点保存累积危险函数。如果数据集中的唯一时间点数量大于CHFS增长量,那么必须对我的时间变量进行舍入,这会显着缩短运行时间。

© www.soinside.com 2019 - 2024. All rights reserved.