one-hot-encoding 相关问题

One-Hot Encoding是一种将分类变量编码为机器学习算法可以处理的数值数据的方法。

OneHotEncoder:__init __()获得了意外的关键字参数'categorical_features'

我在onehotencoder中遇到此错误,缺少thecategorical_features属性,我在用google colab。从sklearn.preprocessing导入LabelEncoder,OneHotEncoder le = LabelEncoder()...

回答 1 投票 0

如何在字符级别对句子的矩阵进行一次热编码?

[有一个数据帧:0 1 2 3 0 ace NaN 1 bd NaN NaN 2 bc NaN NaN 3 abcd 4 ab NaN NaN 5 bc NaN NaN 6 ab NaN NaN 7 abce 8 ...

回答 1 投票 1

对R中的Int矩阵中的每一列进行热编码

我在R中将矩阵转换为一种热编码的问题。我在Matlab中实现,但是在R中处理该对象有困难。在这里,我有一个'matrix'类型的对象。我想...

回答 1 投票 0

OneHotEncoder ValueError:找到未知类别

我正在使用完整文件构建OneHotEncoder。 def buildOneHotEncoder(training_file_name,categoricalCols):one_hot_encoder = OneHotEncoder(sparse = False)df = pd.read_csv(...

回答 1 投票 0


在Spark中,如何仅对前N个频繁值进行一次热编码?

[在数据框df中,我有一列my_category,其中具有不同的值,可以使用以下方法查看值计数:df.groupBy(“ my_category”)。count()。show()值计数为197 b ...

回答 1 投票 0

Apache Spark(Scala)代码中的索引器错误?

从Apache Spark文档复制并粘贴的确切代码给我错误(请参见快照),导入org.apache.spark.ml.feature。{OneHotEncoder,StringIndexer} val df = spark ....

回答 1 投票 -2

处理要预测的元组中的分类值

我正在使用经过训练的sklearn模型构建API。我已将模型保存为.joblib格式,并在进行预测之前将其加载到API后端中。但是问题是我的数据包含...

回答 1 投票 0

Python sklearn OneHotEncoder:如何跳过列表中不存在的值

我想对此列表进行一键编码:[0 0 1 1 1 2 2 2 2 4]当我这样做时,一键编码器将我的4转换为3。也就是说,我得到了:(0, 0)1.0(1,0)1.0(2,0)1.0(3,1)1.0(4,1)1.0(5,1)...

回答 1 投票 0

Scikit-Learn-对熊猫数据帧的某些列进行一次热编码

我有一个带有整数,浮点数和字符串列的数据框X。我想对“对象”类型的每一列进行一次热编码,所以我尝试这样做:encoding_needed = X.select_dtypes(include ='...

回答 2 投票 0

编码分类变量后如何跟踪列?

我想知道一旦对数据集进行数据预处理,如何跟踪数据集的原始列?在下面的代码中,df_columns会告诉我df_array中的第0列是A,第1列...

回答 1 投票 1

使用一个热编码器时要使用什么来代替不推荐使用的分类功能?

[将numpy作为np导入,将熊猫作为pd导入,将matplotlib.pyplot作为plt数据集= pd.read_csv('my_file_name.csv')X =数据集.iloc [:, 3:13]。值y =数据集.iloc [:,, 13] .sklearn中的值。...

回答 1 投票 0

使用tf.data的一次热编码混合了列

最小工作示例,请考虑以下CSV文件(example.csv)动物,大小,重量,狮子,大,200,哺乳动物鸵鸟,大,150,麻雀,小,0.1,大鲸鱼,大,3000,哺乳动物bat,...

回答 1 投票 1

如何通过keras LSTM层传递此模拟的单热编码数据?

[据我所知,在Keras中,LSTM层期望输入数据具有3维:(batch_size,timesteps,input_dim)。但是,我真的很难理解这些值实际上是什么...

回答 1 投票 0

仅对列的某些元素进行热编码

在我的数据集上,我有很多列,其中包含分类和数值的混合值。基本上,当数值不可用时,将分配一个代码,例如'M','C'等。与原因...

回答 1 投票 0

ROC曲线图

[尝试使用SVM绘制具有179列(作为特征)的大小为1200的数据集的ROC曲线会出现以下错误:'数组的索引过多'代码:来自sklearn.svm ...

回答 1 投票 0

经过培训和测试,如何处理新数据?

我有2个问题。我有一个包含分类特征和数字的数据集。我的目的是预测个人的贷款等级。我对数据集1采取的步骤如下:1)...

回答 1 投票 0


在sparklyr中使用ft_one_hot_encoder()时出错

我有一个带有分类变量的数据集,我想在sparklyr中使用一键编码进行编码。下面是表头和我正在使用的代码:tbl_name%>%ft_one_hot_encoder(input_col = ...

回答 1 投票 0

如何将numpy数组作为逻辑回归的输入?

目前,我正在开发一个视频推荐系统,该系统将以0(负)和1(正)的形式预测视频。我成功地从YouTube抓取了数据集,并找到了...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.