one-hot-encoding 相关问题

One-Hot Encoding是一种将分类变量编码为机器学习算法可以处理的数值数据的方法。

如何在同一类别类型的多列上运行 get_dummies() 函数?

我有 DataFrame 的功能(让我们说)如下所示: 症状一 症状B 瘙痒 皮疹 皮疹 瘙痒 当我在此数据帧上运行 get_dummies 函数时,它将创建四列 nam...

回答 1 投票 0

如何对 Pandas.DataFrame 中的文本数据进行矢量化,然后在模型“内部”对其进行 one_hot 编码

我尝试实现基于one-hot编码向量序列的序列模型(经过训练来预测下一个单词)。我的自定义 one-hot 编码器运行良好。但就像锻炼一样,我想做所有的事情

回答 0 投票 0

我在一开始就删除了空值,但是在一次热编码之后,存在空值

我读取了数据集并检查了空值,它显示有两行包含空值,所以我删除了这两行。然后检查是否有任何空值,但它没有显示空值,所以我赞成...

回答 0 投票 0

One-Hot-Encoding 删除我列中的 3 个值

来自 sklearn.preprocessing 导入 OneHotEncoder column_to_encode = ['性别','Fasting_Blood_Sugar','Exercise_Angina'] # 创建标称编码器对象 编码器 = OneHotEncoder(drop="first")...

回答 0 投票 0

一个热编码正在删除我所有列中的 3 个值

来自 sklearn.preprocessing 导入 OneHotEncoder column_to_encode = ['性别','Fasting_Blood_Sugar','Exercise_Angina'] # 创建标称编码器对象 编码器 = OneHotEncoder(drop="first") ...

回答 0 投票 0

找到对应于类别的一个热编码中分配的二进制矩阵

我有熊猫数据框 df。 df['downtime] 有这样的输出; R1 R1 R2 R3 R1 北美 我将 df['downtime] 编码如下; enc_downtime_code = OneHotEncoder() downtime_code_enc = enc_downtime_code.

回答 1 投票 0

为什么在我应用一种热编码后我的数据帧值被 nan 值替换?

我正在做一个分类机器学习项目并使用来自 kaggle.text 的数据。 一开始我去掉了所有的空值和一些不相关的列,然后我打算转换所有的类别...

回答 1 投票 0

ValueError:传递值的形状是 (1000, 1),索引表示 (1000, 20)

ValueError:传递值的形状是 (1000, 1),索引表示 (1000, 20) 这是我在 python 中的代码 编码 = OneHotEncoder() encoded_cols = encode.fit_transform(data[['Sex', 'Housing', 'Saving acco...

回答 1 投票 0

R 制作具有所有可能因子级别的稀疏矩阵(数据中还没有全部存在)

我正在对一些数据进行机器学习。一个变量是一个因素,有 100 个可能的水平(“n01”、“n02”、...、“n100”)。现有数据只有80级。那么……

回答 0 投票 0

如何将一个热标签列转换成它们原来的列标签

我使用一个热标签进行了多标签文本数据扩充,现在我想返回 23 个标签,分为 23 列,每个标签对应一个值。 我想要这个输入图像描述...

回答 0 投票 0

决策树分类器将浮点值视为数字数据,但需要成为一种热编码数据类型

我正在对图片中的数据运行决策树分类器。在图片中,您可以看到时间签名和签名密钥等类型的数据需要进行一次热编码...

回答 1 投票 0

训练神经网络从单个特征中生成单热编码向量

我想建立一个神经网络,它接受一个自然数并生成一个对应于该数字的单热编码向量。 示例:2 -> (0, 0, 1, 0, ...) 更正式地说,我想要...

回答 1 投票 0

无法分配 GiB - 多列上的 pandas get_dummies

以下代码有效,但由于 Pandas 无法为具有形状 X 和数据类型 Y 的数组分配 GiB,因此在应用于我的数据帧时它会中断。我试图用 dask.datafra 解决问题...

回答 1 投票 0

Convert Categorical into Numerical Python Panda Columns must be same length as key

我是 Python 的新手,开始使用 Python 学习数据科学。请帮助解决我的问题。 我正在关注这个 youtube 视频教程:https://www.youtube.com/watch?v=DPeTCC9Qm80 进行转换

回答 1 投票 0

跨多列存储数据时的单热编码

说我有一个数据框 原色 二次色 第三色 红色的 蓝色的 绿色的 黄色的 红色的 北美 我希望通过检查颜色是否存在于三列(1)或...中的任何一列来进行编码...

回答 5 投票 0

FileNotFoundError: [Errno 2] 图像数据集单热编码没有这样的文件或目录

我尝试在我的图像数据集中使用 to_categorical() 进行单热编码,但由于 FileNotFoundError: [Errno 2] No such file or directory 错误而失败,代码如下, 导入操作系统 小鬼...

回答 0 投票 0

在R语言中如何处理包含多个逗号分隔值的列的问题

在我的数据集(CSV文件)中有一列,即设施,它包含了{"无线上网"、"轮椅无障碍"、厨房、电梯、"无蜂鸣器内通"、暖气、洗衣机、烘干机等值。它包含的值有{"无线上网", "轮椅无障碍",厨房,电梯, "蜂鸣器无线对讲",暖气,洗衣机,烘干机,...。

回答 1 投票 0

如何保留模型生成时的Scikit-learn OneHotEncoding用于新数据?

我正在使用OneHotEncoding为一个分类问题生成假人。当用于训练数据时,我得到了大约300个假人列,这很好。但是,当我输入新数据(行数较少)时,...

回答 1 投票 -1

如何将keras tokenizer. texts_to_matrix(一热编码矩阵)的单词转换成文本。

我参考了这个帖子,其中讨论了如何使用 reverse_map 策略从 keras 中 tokenizer 的 text_to_sequences 函数获取文本。我想知道是否有一个函数可以获取文本......

回答 1 投票 0

如何利用矢量化快速解码一热编码的NumPy矩阵?

给定一个形状(高,宽)的图像矩阵,其值在uint8范围内,它被一热编码(转换为分类)为形状(高,宽,n),其中n是可能的数量 ...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.