one-hot-encoding 相关问题

One-Hot Encoding是一种将分类变量编码为机器学习算法可以处理的数值数据的方法。

ValueError:input_features 不等于feature_names_in_

出现上述错误的python代码是: # 要编码的分类列:Cols_to_encod Cols_to_encod = list(X.columns[X.dtypes == 'object']) # 创建变压器 哦= OneHotEncoder(稀疏=...

回答 2 投票 0

关于onehotencoder空间成本

为什么onehotencoding不使用基于位的编码?占用的内存不是少很多吗?我的意思是,当你对四个城市进行编码时,你可以像 onehotencoder 那样通过扩展来完成......

回答 1 投票 0

如何在Python中自动虚拟编码高基数变量

我正在研究 Kaggle 上的数据工程师薪资数据集。 salary_currency 列具有以下值计数。 工资货币 13695 美元 558 英镑 406 欧元 51 印度卢比 CAD...

回答 1 投票 0

大维度单热编码

我正在构建一个销售预测模型,其中包含“年”,“月”,“经济指标”,“Customer_Id”,“Product_Id”,“Quantity”,&...

回答 1 投票 0

如何恢复或转换one-hot编码列并显示原始特征的特征重要性而不是编码形式?

使用RandomForestClassifier,这是当前重要的功能列表: 帐单长度 0.367075 鳍状肢长度毫米 0.196314 帐单深度 0.153329 身体质量g 0.152304

回答 1 投票 0

Core ML MLOneHotEncoder 更新后错误:“未知类别字符串”

Stack Overflow 社区, 我最近将 Xcode 和 Core ML 从版本 13.0.1 更新到 14.1.2,并且在 Core ML 分类器中面临 MLOneHotEncoder 的问题。相同的代码和数据...

回答 1 投票 0

ValueError:对于稀疏输出,所有列都应该是数字或可转换为数字

我在应用 sklearn 模型之前对数据进行预处理,但我无法确定错误不断发生的原因。当我为

回答 1 投票 0

Keras 网络使用 Scikit-Learn 管道导致 ValueError

我正在努力使用 Keras 和 Scikit-Learn Pipeline 构建一个神经网络进行预处理。到目前为止,我已经能够构建管道和初始模型架构(非常基本),但是有...

回答 2 投票 0

ML ColumnTransformer OneHotEncoder

在数据帧的第一列中转换分类数据时,我使用 OneHotEncoder 得到了 ColumnTransformer 的奇怪行为。当我向 csv 文件添加一行时,会发生此行为。 在...

回答 1 投票 0

排查从 Jupyter Notebook 到 .py 文件的自定义管道类转换中的 OneHotEncoder 问题

tl;dr:我在 ipynb 文件中定义了一个管道,工作正常,但是当我尝试将其封装在一个类中时,它没有按预期工作。我可能在 OneHoteEncode 中犯了一些错误。曲...

回答 1 投票 0

我可以为one-hot编码功能添加多级索引吗?

我正在研究蘑菇特征的数据集,几乎所有特征都用 pandas 编码成二进制,但有些是名义上编码的。我想知道我是否可以将原始专栏作为第二个我...

回答 1 投票 0

使用 arrow-rs 加载数据时进行单热编码

在我的 Rust 项目中,我从 Mongo 加载文档并将它们反序列化为 serde_json 值: 匹配光标.deserialize_current() { 好的(d)=> { 让 doc = serde_json::to_value(&d).

回答 1 投票 0

类型错误:不可哈希类型:pd.get_dummies 的“系列”

我正在尝试对我拥有的数据框中的一些标称数据使用 pd.get_dummies (来自 Kaggle 的 House 回归)。我将所有名义类别分成列名称列表,'obj_nomin...

回答 1 投票 0

OneHotEncoding 数据集中的多列一次

考虑以下简单的片段数据集: 2 列:X、Y。 X 和 Y 列都只有 3 个可选类别值 我想对这些列进行编码。 我的尝试: 将 numpy 导入为 np 导入...

回答 2 投票 0

Pyspark one-hot 编码与分组相同的 id

有没有一种方法可以在 Spark 中执行 OHE 并“展平”数据集,以便每个 Id 只有一行? 例如,如果输入是这样的: +---+--------+ | id|类别| +---+--------+ | 0|一个| | 1| ...

回答 1 投票 0

tensorflow One Hot Encodings 的使用

我收到此功能的断言错误...我该如何解决这个问题 def one_hot_matrix(标签,深度=6): one_hot = tf.one_hot(标签、深度、轴 = 0) one_hot = tf.reshape(one_hot, (-1...

回答 3 投票 0

R 对分类变量级别低于训练数据的新数据进行预测

我需要对一些数据进行分类(R xgboost 或 catboost 等),这些数据共有大约 30 个输入变量。数据集变量之一是因子变量,有 100 个可能的级别(&qu...

回答 1 投票 0

OneHotEncoder 没有表现?

我获得了一个代码块,可以在 Jupyter 中运行来了解 One Hot Encoding,当我运行代码时,会出现错误。 从 sklearn.preprocessing 导入 OneHotEncoder 作为 ohc enc = ohc(drop='

回答 1 投票 0

如何在具有分类和数字特征的 pandas 数据帧上应用一种热编码?

一些特征是数字的,例如“学校毕业率”,而其他特征是分类的,例如学校名称。我在类别特征上使用了标签编码器...

回答 1 投票 0

如何制作一个单神经元神经网络?

我想制作一个像 w1x1+w2x2+w3*x3+b1 这样的单神经元函数 我的训练输入是 [1,0,0], [0, 1, 0], [0,0,1], [...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.