one-hot-encoding 相关问题

One-Hot Encoding是一种将分类变量编码为机器学习算法可以处理的数值数据的方法。

带分类数据集的单次编码:如何处理分类数据中的不同值(较少的数字)

训练数据集总分类列:27测试数据集总分类列:27 OH_encoder = OneHotEncoder(handle_unknown ='ignore',sparse = False)OH_cols_test = pd.DataFrame(OH_encoder ....

回答 1 投票 1

如何仅预测张量流中的一类

如果您只想预测一个班级,然后,首先您需要以某种方式标记向量,以使所有这些向量都标记为“ one”,其基本真理为5,而这些向量为“零” ...

回答 1 投票 1

一个热编码器是什么行业规范,在编码/分割之前或之后编码

我知道有人回答了这个问题。我仍然在努力弄清楚这一点。我仍然对一个热编码器有些困惑。我只是在想,如果我们要编码...

回答 1 投票 0

如何在Python中为连续数据编码虚拟变量,以便始终保持相同的顺序?

确实是一个简单的问题,我的数据集太大而无法保存到内存中,因此必须加载它,然后对其进行顺序的机器学习。我的功能之一是绝对的,我会...

回答 1 投票 1

是否将函数应用于数据框列?

我具有以下功能(采用一列作为输入的单热编码功能)。我基本上想将其应用于数据框中的一列,但似乎无法理解到底出了什么问题。 ...

回答 2 投票 0

如何将数据框列的分类值转换为sckikit-learn中的一键编码列?

给出数据帧df具有类别值['A','B','C']的列字母,我想获得数据帧中的许多列,其中每一行只有一个非零值,对应于...

回答 1 投票 2

scikit-learn:如果在进行一次热编码后,其特征少于训练/测试集的特征,如何预测新数据

我试图在我的第一个ML项目中使用scikit-learn,将其DecisionTreeClassifier与包含数字和分类特征的数据样本一起使用,例如:['High',33,'No',4]。我在...

回答 1 投票 0

尝试使用one_hot编码时出错

我知道这可能是一个重复的问题,但是我发现其他答案在我的情况下不起作用。我正在使用以下数据集:> str(total_data)'data.frame':32260个观察值。之13 ...

回答 1 投票 0

SciKit-Learn标签编码器,导致错误'参数必须是字符串或数字'

我有点困惑-在这里创建ML模型。我正在尝试从“大”数据框(180列)中获取分类特征并对其进行一次热分析,以便可以找到...

回答 1 投票 1

IndexError:用作索引的数组必须为OneHotEncoding期间的整数(或布尔)类型错误

我有一个包含类别变量的数据框,我想应用OneHotEncoder。我的问题是在OneHotEncoder之前使用LabelEncoder解决的,但是对我来说这没有意义,因为使用...

回答 1 投票 -1

OneHotEncoder类别参数

使用sklearn 0.22,将删除categorical_features参数,因此以下代码不再可执行:从sklearn.preprocessing import numpy as np导入numpy X = np ....

回答 1 投票 1

OneMLt使用ML.NET编码文本数组

我有一个如下的InputData类public class InputData {public string [] TextFields {get;组; } public float [] NumericFields {get;组; }}在构建管道时,我可以轻松地...

回答 1 投票 0

在python中执行OneHotEncoder后,保留列名的最佳方法是什么?

在python中执行一个热编码器后,保留列名的最佳方法是什么?我所有的功能都是分类的,因此我如下所示:因此,在导入数据集后,它看起来就像在PlaceID ...

回答 1 投票 0

使用python快速编码的快速方法

在我的项目中,我需要为〜100次的数百万个DNA序列(总共数十亿次相似序列)制作一个hotEncode。因此,有效的方法对我来说将是非常重要的。波纹管是...

回答 1 投票 0

使用带有列名和值的字典对熊猫数据帧进行一次热编码

我目前有以下代码,使用字典对熊猫数据框进行一次编码,其中的键是要素名称,值是要素值列表。 def dummy_encode_dataframe(self,df,...

回答 2 投票 0

。fit()方法中如何对多个标签(训练)使用一种热编码?

我有一个移动价格分类数据集,其中有20个要素和一个名为price_range的目标变量。我需要将移动价格分类为低,中,高,非常高。我已经应用了...

回答 1 投票 1

如何解决这个问题

错误如下。所有输入数组必须具有相同的形状

回答 1 投票 0

如何解决此一键编码错误,“所有输入数组必须具有相同的形状”

我正在尝试使用一键编码转换DNA序列,但是遇到了麻烦,需要帮助...我尝试了很多方法,但对我不起作用。此代码正常工作:将numpy导入为np,将pandas导入为pd ...

回答 1 投票 0

在scikit-learn版本0.21.2中的OneHotEncoder中使用active_features_和feature_indices _

我对在Python中使用scikit库非常陌生,我的scikit-learn版本为0.21.2。我已经使用OneHotEncoder对数据集中的分类变量进行编码。现在我正在尝试链接...

回答 1 投票 1

将系数分配回多元线性回归中的分类变量

[通过使用Sciki-learn进行多元线性回归,我需要获得一个像Y = a + bX1 + cX2 + dX2 + eX3 + fX4 + gX5的方程,其中b,c,d,e,f和g为每个...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.