我正在研究UCI帕金森数据库https://archive.ics.uci.edu/ml/machine-learning-databases/parkinsons/当我使用统计模型运行逻辑回归时,所有功能都显得微不足道,需要建议以转换功能。
logit = sm.Logit(y, X_std)
result = logit.fit()
print(result.summary())
模型精度高达85%,但这没有意义,因为所有功能都不重要。
请帮助
您的样本大小不足以可靠地估计这么多参数。如果解释变量之间存在相关性,那么即使它们共同具有预测能力,它们在统计上也可以忽略不计。