我正在对
https://hastie.su.domains/ElemStatLearn/
的垃圾邮件数据集进行逻辑回归。因变量在最后一列,在我将数据导入 R 后给出为 V58。当我最初运行模型时,算法没有收敛,所以我运行了惩罚逻辑回归。然后我收到以下消息:
“非收敛PL置信限:变量的最大迭代次数:V3、V4、V6、V7、V8、V9、V11、V12、V15、V16、V17、V20、V21、V22、V23、V24、V25、V27、 V30, V31, V32, V37, V38, V39, V40, V49, V50, V52, V53, V54, V55, V56, V57, V58 exceeded. 尝试通过传递 'logistpl.control(maxit=. ..)' 到参数 plcontrol".
我尝试了不同的最大迭代值和最大步长值,但没有改变。我认为我也不需要标准化这些价值观。我错过了什么?
spam.data <- data_frame(read.table(datapathname))
dim(spam.data)
str(spam.data)
summary(spam.data)
set.seed(2718)
row.number = sample(1:nrow(spam.data), 0.7*nrow(spam.data))
train = spam.data[row.number,]
test = spam.data[-row.number,]
dim(train)
dim(test)
model.logistic = glm(as.factor(spam.data[58])~., data=train, family=binomial) #The error gets thrown here.
model.logistic1 = logistf(as.factor(unlist(train[58]))~., data = train)