在机器学习中,这是选择最相关特征的子集来构建数据模型的过程。
我的数据集是31000行,具有13个属性。但是因为大多数是分类的,所以我不得不对这些属性使用NominalToBinary,因此属性增加到61。我将数据采样到...
我正在尝试将分类列值编码为百分比频率(二进制编码),作为新功能。值计数频率(%)20190 14723 16.2%20100 11235 12.4%20120 9449 10.4%...
我正在尝试找到重要的特征。我使用的模型不同,但是每个模型都能给我带来不同的结果,我无法理解为什么。我想看看哪种假设适用于每个...
im试图使用SVM在纸上复制实验,以增加我对机器学习的了解/知识。在本文中,作者提取特征并选择特征尺寸。他,...
假设我们有一个由6位数字字符串(所有小写字母)组成的数据集,例如“ olmido”和相应的二进制值。例如,“ olmido”的值为1,而“ lgoead”的值为0。...
[使用sklearn的feature_selection函数进行特征选择时,是否可以跟踪实际的特征名称,而不是默认的“ f1”,“ f2”等...?我有大量的...
sklearn包含不同特征选择方法(过滤器/包装器/嵌入式)的实现。所有这些方法都是为静态系统设计的。 sklearn是否支持动态选择特征...
我正在训练一个模型来检测垃圾邮件/火腿电子邮件,并通过以下方式进行功能选择:t = TfidfVectorizer(max_features = num_feature)t.fit_transform(spam_corpus)spam_features = t.get_feature_names()t ....
我在Sklearn的Pipeline()类中使用SelectKBest()将功能数量从30个减少到5个最佳功能。当我适合分类器时,通过...
我仅尝试在活动选择中更改Catia中的属性。我希望采用此代码并将其概括化,以便与其针对1个特定项目,不如将其激活为...
我想知道我的RF模型中功能的名称。我在这里阅读到gs.best_estimator_.named_steps [“ stepname”]。feature_importances_的输出将镜像我的数据列。 ...
我有一个庞大的数据集,其中包含数值变量和分类变量。我遇到了主要针对数值或分类数据的各种特征选择技术...
使用scikit-learn进行SVR的递归特征消除和网格搜索
我正在使用SVR解决预测问题,我想进行特征选择以及超参数搜索。我正在尝试同时使用RFECV和GridSearchCV,但是从我的...
我研究了找到特征重要性的方法(我的数据集只有9个特征)。以下是实现特征重要性的两种方法,但是我很难编写python代码。我正在寻找...
我正在测试用于特征选择的嵌入式方法。我了解(也许我误会了),使用嵌入式方法,我们可以在训练的同时获得最佳功能(基于功能的重要性)...
不能与sklearn RFE一起使用XGBRegressor
帮助,这个简单的代码产生了一个奇怪的错误。从sklearn.feature_selection导入从xgboost.sklearn导入RFECV导入XGBRegressor从sklearn.metrics导入sklearn.metrics导入...
[有人可以给我一些有关我应该使用哪种特征选择技术进行基因分类的建议吗?
我看了几篇文章和有关特征选择(包装器和嵌入式方法)的示例,在这些文章中,他们将样本数据分为训练集和测试集。我了解为什么我们需要使用交叉验证(...
如何使用筛选方法创建流水线,以选择相关度高于值的结果(特征)?
我想实现特征选择的混合方法如下:过滤器方法(单变量特征选择,使用相关性,所有相关性高于X值的特征将传递到下一步:...
数据集由N个元素和K个变量组成。使用PCA,我可以减少变量的数量,但是如何检查K个变量中提供最多信息的变量呢?例如我有数据集...