在机器学习中,这是选择最相关特征的子集来构建数据模型的过程。
如何修复:“FitFailedWarning:Estimator fit failed。这些参数在这个训练测试分区上的分数将设置为 nan?”
从 sklearn.model_selection 导入 GridSearchCV,KFold param_grid = {'select__k': np.arange(1, data_x_numeric.shape[1] + 1)} cv = KFold(n_splits=3, random_state=1, shuffle=True) gcv = GridSearchC...
我有一个包含 484 行和 69 列的数据集。自从没有。列数非常高,模型的准确度很差(在 10% 到 20% 之间)。这也是多类分类问题。
我知道llr只是每个观察值对其观察值所占概率的对数之和。我也知道理论上对数损失是负对数似然。但我是
我想用轮盘赌实现遗传算法进行特征选择,谁能帮我? 我在 python 中检查了一些库,但我不能
如何使用 Leave One Group Out 作为特征选择的交叉验证?
我有 16 个 csv 文件,每个文件包含大约 11250 行,其中包含 19 个特征和一列标签。我想实施 Leave One Group Out 作为特征选择算法的交叉验证...
特征重要性,需要将最重要的变量捕获到数据框中,类似于 Boruta (R) 但在 Python 中
问题 在 RandomForestRegressor 上使用特征重要性,需要将最重要的变量捕获到数据框中。 我试过“sorted_indices = np.argsort(importance)[::-1][:n]”,其中 n...
我正在构建一个用于拟合模型的ML流水线,在其对SVMs的优化过程中会做一些步骤。其中一个步骤是使用Sklearn的SelectKBest包进行特征选择......。
我正在尝试分析下面的数据,先用逻辑回归建模,然后做预测,计算准确率& auc; 然后进行递归特征选择,计算 ...
data=pd.read_csv("https:/raw.githubusercontent.comsharmaroshanOnline-Shoppers-Purchasing- Intentionmasteronline_shoppers_intention.csv") 我试图基于方差分析进行特征选择(......
我有一个交叉数据集,重复了2年,2009年和2010年。我使用第一年(2009年)作为训练集来训练一个回归问题的随机森林,第二年(2010年)作为 ...
我读到建议在特征提取过程后使用特征选择。但我读到的所有帖子中都缺少一些东西。假设我们有50个特征 假设我们使用特征...
我正在尝试分析下面的数据,先用逻辑回归建模,然后做预测,计算准确率& auc; 然后进行递归特征选择,计算 ...
当我试图在sklearn中的一些数据上使用特征选择和f_classif(方差分析测试)时,我得到了以下警告信息。C:Users/Alexander/Anaconda3/lib/site-packages/sklearn/...
我很希望对这个问题有一些见解--我试图在文献中找到解释,但我陷入了困境。所以我正在构建一个神经网络(使用Keras)来解决一个回归问题。我有~...
我试图让我的数据集的特征列表大于0.15它的代码让我这样做,但我有作为结果的serie熊猫,我不能检索的列名在列表中做的下降后......
我想了解每个被选中的特征所得到的分数是否相关。到目前为止,我已经尝试了这样做: classifier = SelectFromModel(RandomForestClassifier(n_estimators = 100)) m = ...
谁能给我建议在机器学习中从数据集中选择更好的特征的方法?[关闭]
我是机器学习的新手,我一直在用一些数据集练习,我用相关值选择数据集的特征,但令人惊讶的是,我观察到的是,当我尝试各种......
给出下面一个简单的特征选择代码,我想知道特征选择后的选择列(数据集包括一个头V1 ... V20) import pandas as pd from sklearn........。
我的数据集有超过200个变量 我在上面运行一个分类模型 这导致了模型的OverFit. 哪种建议用于减少特征的数量?我开始用特征...