one-hot-encoding 相关问题

One-Hot Encoding是一种将分类变量编码为机器学习算法可以处理的数值数据的方法。

为什么 pd.get_dummies 返回布尔值而不是 0 1 的二进制值

我不知道为什么我的One-Hot编码代码; “pd.get_dummies”返回布尔值而不是 0 1 的二进制文件 df = pd.get_dummies(df) 编写以下代码行后; df...

回答 1 投票 0

如何在不将数据帧转换为数组的情况下执行一次热编码?

我有 df 数据框,其中包含分类特征列“temp_of_extremities”、“peripheral_pulse”、“mucous_membrane”。 我想对分类特征进行编码,如下所示: 从 sklearn.preprocessing 导入

回答 1 投票 0

sklearn 一种热编码。 ValueError:对于稀疏输出,所有列都应该是数字或可转换为数字

我是 sklearn 编码新手,我需要对 dtaset 的 3 列进行编码,我尝试仅对一列进行编码,但它向我发送了一个错误 *ValueError Traceback(最近的...

回答 1 投票 0

在 R 中高效解码多个热编码列

我有以下数据框: id = c(1,2,3) 其中_home = c(1, 0, NA) 其中_work = c(0, 1, NA) with_alone = c(0,0,0) with_parents = c(0,1,1) with_colleagues = c(1,1,0) 性别_男性 = c(1,0,1)

回答 1 投票 0

转换多个热编码列并转换为长格式

我有一个相当复杂的数据框架结构: ID = c(1,2,3) 会话 = c("2023-11-14 19:01:39+01:00", "2023-11-14 20:01:39+01:00", "2023-11-14 21:01:39+ 01:00") P_affe...

回答 1 投票 0

在转换热编码列时制作数据帧长格式

我在 R 中有以下数据框: # 制作数据框 会话 = c("2023-11-14 19:01:39+01:00", "2023-11-14 20:01:39+01:00", "2023-11-14 21:01:39+ 01:00") P_影响...

回答 1 投票 0

如何在 R 中对多个分类变量进行一次热编码

我正在研究一个预测问题,我正在 R 中构建一棵决策树,我有几个分类变量,我想在我的训练和测试集中对它们进行一致的单热编码。 我妈...

回答 5 投票 0

AxisError:轴 1 超出维度 1 数组的范围(OneHotEncoded python)

我正在研究狗品种的分类模型,我正在尝试显示标签示例及其各自的热编码标签,但我收到一条错误消息,指出 AxisError: axis 1 is ou...

回答 1 投票 0

在 sklearn 一种热编码中删除列以避免虚拟变量陷阱的必要性

我针对线性回归问题测试了 sklearn One Hot Encoding,先删除和不先删除。它表明当没有删除列时 r_2 分数更好。 来自 sklearn.preprocessing ...

回答 3 投票 0

XGBoost 错误 - 当提供分类类型时,DMatrix 参数 `enable_categorical` 必须设置为 `True`

我有四个类别特征和第五个数字特征(Var5)。当我尝试以下代码时: cat_attribs = ['var1','var2','var3','var4'] full_pipeline = ColumnTransformer([('猫', OneHotEncoder(

回答 2 投票 0

将所需列中的分类数据更改为数值数据,以便可以对其应用线性回归

在此输入图像描述 给定数据集上的某些列包含分类数据。我必须将数据更改为数字,以便我可以应用简单线性回归来预测...

回答 1 投票 0

序数编码或 One-Hot 编码

如果我们不确定分类特征的性质,例如它们是名义特征还是序数特征,我们应该使用哪种编码?序数编码还是单热编码? 有没有明确的规定...

回答 1 投票 0

得到“TypeError:OneHotEncoder.__init__()得到了意外的关键字参数‘categorical_features’”

我写了以下代码, 这里我附上了代码图片 从 sklearn.preprocessing 导入 OneHotEncoder ohe = OneHotEncoder(categorical_features=[0]) 它给了我, 类型错误:OneHotEncoder.in...

回答 1 投票 0

将 Scikit-Learn OneHotEncoder 与 Pandas DataFrame 结合使用

我正在尝试使用 Scikit-Learn 的 OneHotEncoder 将 Pandas DataFrame 中包含字符串的列替换为 one-hot 编码的等效项。我的下面的代码不起作用: 来自 sklearn.preproces...

回答 7 投票 0

如何在字符串数字上使用序数编码器或热编码器

我有一个数据集,其中有一列包含数字作为字符串,例如“一”,“三”,“五”,“五”等。我想使用序数编码器:一个将是...

回答 2 投票 0

当目标是一个热编码时,随机森林预测任一类别

我相当清楚树对一个热编码(OHE)目标很敏感,但是我想了解为什么它返回这样的预测: `数组([[0, 0, 0, 0], [0,0,0,0], ...

回答 1 投票 0

one-hot-encoding:应用编码来训练和测试数据帧后出现拟合问题

我有 2 个数据框,测试和训练,一开始具有相同的列数。 但是,因为在具有分类数据的列中,2 个数据框具有不同的值,之后

回答 1 投票 0

我需要在回归中手动处理虚拟变量陷阱还是 sklearn 会做到吗?

我知道在训练机器学习算法之前我们必须对分类数据进行one-hot编码。但我的问题是我们需要手动删除一列还是 sklearn 会做到这一点?

回答 4 投票 0

每列中有多个值的DataFrame。如何在主标题下对它们进行一次性编码?

我有一个数据框,每列中都有一个变量列表。我不知道如何对每一列中的数据进行 One-Hot 编码。 在: lst = [['红、蓝、黄'、'蓝、绿、黄'、'格力...

回答 2 投票 0

Python 中的 OneHotEncoding、列变换器和线性回归出现问题

我在 Python 脚本中使用 ColumnTransformer 来转换数据集中的分类变量,以便在线性回归模型中使用。我使用 OneHotEncoder 来转换分类变量...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.