one-hot-encoding 相关问题

One-Hot Encoding是一种将分类变量编码为机器学习算法可以处理的数值数据的方法。

PCA可以应用于单热编码数据吗?

我对PCA的概念完全陌生。据我了解,PCA使用平方和方法。话虽如此,我遇到了一个单编码的数据(这意味着我正在处理分类数据)。...

回答 1 投票 0

如何在熊猫中对2列应用一种热编码或使虚拟对象在一起?

我在下面的数据帧中包含一些示例值,例如:-df = pd.DataFrame([[[“ London”,“ Cambridge”,20],[“ Cambridge”,“ London”,10],[“ Liverpool”,“伦敦”,30]],列= [“ city_1”,“ city_2”,“ id”] ...

回答 1 投票 2

基于原始列的dtype是对象,在数据框中创建多个虚拟变量的最佳方法是什么?

我有一个DataFrame,其中有许多列根据其dtype是一个对象而需要被屏蔽。一种热编码/伪装这些列的最快,最有效的方法是什么?清单理解力? ...

回答 1 投票 0

编码分类变量,如“状态名称”

我有一个带有“状态名称”的分类列。我不确定为了将它们转换为数字类型必须执行哪种类型的分类编码。有83个唯一的州名。 ...

回答 1 投票 1

如何使用LabelBinarizer对训练和测试进行正确的热编码

假设我有这样的火车:名称|天------------第一| 0秒| 1第三| 1个| 2还有一个不包含所有这些名称或日期的测试集。像这样:名称|天--...

回答 2 投票 0

如何在张量流RNN中正确处理一维编码和多维数据

我正在创建一个对字母序列进行分类的二进制分类器,例如'BA'。每个序列由2个字母组成,这些字母被编码为“一键热”向量。例如,序列'BA'为[[0,1,0,0],[1,0,...

回答 1 投票 1

ValueError:形状不匹配:如果category是一个数组,则它必须是形状(n_features,)

我创建了一个简单的代码来实现OneHotEncoder。从sklearn.preprocessing导入OneHotEncoder X = [[[0,'a'],[0,'b'],[1,'a'],[2,'b']] onehotencoder = OneHotEncoder(类别= [0] )X = ...

回答 1 投票 0

一个热编码器-类别特征错误

尝试使用scikit-learn的OneHotEncoder时出现以下错误:TypeError:init()得到了意外的关键字参数'categorical_features'。如何解决此错误?这是...

回答 1 投票 0

如何将布尔表有效地转换为一个热向量?

假设我的桌子看起来像这样-电影动作科幻戏剧浪漫Abc真错误False False Def False ...

回答 1 投票 1

一种热编码后如何预处理测试数据

我在这里有点困惑,我对所有<10个唯一值low_cardinality_cols的分类列进行了热编码,并删除了Training和...的剩余分类列。]

回答 1 投票 1

将numpy数组的部分复制到具有额外维度的另一个数组中

但是,我试图使用机器学习进行语义分割,但是我设法找到一种方法来获取正确的热编码(使用此方法:https://www.jeremyjordan.me/semantic-segmentation/)...] >

回答 1 投票 2

New Sklearn语法

我该如何重写此代码,以便它可以与sckit-learn 0.22版本一起使用?从sklearn.preprocessing导入LabelEncoder,OneHotEncoderlabelencoder = LabelEncoder()x [:,0] = labelencoder ....

回答 1 投票 0

如何在OneHotEncoder函数中消除此错误?

代码->#数据预处理#导入库numpy作为np导入matplotlib.pyplot作为plt导入pd熊猫#导入数据集dataset = pd.read_csv('Data.csv')X =数据集....] >

回答 1 投票 1

如何基于使用单次热编码的数据设置标志值

我有一个包含三个表的数据库:我想使用该数据库在R中建立一个机器学习模型,而我需要的数据是这样的:我可以使用一种热编码来转换...

回答 1 投票 1

伪变量级别在看不见的数据中不存在

我已经用5个级别的分类变量训练了逻辑回归模型,所有级别对于该模型都是有意义的。但是,在看不见的数据上,分类的级别数...

回答 1 投票 0

如何在Python中使用多个标签进行热编码?

我有一个CSV表格,看起来像这样:id属性1加拿大1美国2德国3加拿大4德国4美国我想把上面的表格变成:id ...

回答 1 投票 0

如何处理在数据集中的多个列上应用一种热编码后产生的大量恐惧?

我正在从kaggle处理TMDB 5000电影数据集:https://www.kaggle.com/tmdb/tmdb-movie-metadata在预处理阶段,我使用MultiLabelBinarizer()来编码数据集中的列...

回答 2 投票 0

如何在python中写到新的.CSV文件或“另存为新的.CSV文件”

我有一个CSV文件,我想应用一种热编码,然后将新的数据框(数据集)另存为新的CSV文件。但是保存新文件时,它仅写入5行虚拟变量和所有原始行...

回答 1 投票 0

只有两个值的分类变量

我正在处理仅具有类别变量/特征且只有两个值的不同数据集,例如(温度='低'和'高')或(光='开'和'关'或'0'和'1 ')。我不是...

回答 1 投票 0

从OneHotEncoder获得相应的功能

[我尝试使用OneHotEncoder转换特征后对数据集中的某些特征进行数据分析,并且输出显示特征13和特征21是最重要的...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.