one-hot-encoding 相关问题

One-Hot Encoding是一种将分类变量编码为机器学习算法可以处理的数值数据的方法。

Core ML MLOneHotEncoder 更新后错误:“未知类别字符串”

Stack Overflow 社区, 我最近将 Xcode 和 Core ML 从版本 13.0.1 更新到 14.1.2,并且在 Core ML 分类器中面临 MLOneHotEncoder 的问题。相同的代码和数据...

回答 1 投票 0

ValueError:对于稀疏输出,所有列都应该是数字或可转换为数字

我在应用 sklearn 模型之前对数据进行预处理,但我无法确定错误不断发生的原因。当我为

回答 1 投票 0

Keras 网络使用 Scikit-Learn 管道导致 ValueError

我正在努力使用 Keras 和 Scikit-Learn Pipeline 构建一个神经网络进行预处理。到目前为止,我已经能够构建管道和初始模型架构(非常基本),但是有...

回答 2 投票 0

ML ColumnTransformer OneHotEncoder

在数据帧的第一列中转换分类数据时,我使用 OneHotEncoder 得到了 ColumnTransformer 的奇怪行为。当我向 csv 文件添加一行时,会发生此行为。 在...

回答 1 投票 0

排查从 Jupyter Notebook 到 .py 文件的自定义管道类转换中的 OneHotEncoder 问题

tl;dr:我在 ipynb 文件中定义了一个管道,工作正常,但是当我尝试将其封装在一个类中时,它没有按预期工作。我可能在 OneHoteEncode 中犯了一些错误。曲...

回答 1 投票 0

我可以为one-hot编码功能添加多级索引吗?

我正在研究蘑菇特征的数据集,几乎所有特征都用 pandas 编码成二进制,但有些是名义上编码的。我想知道我是否可以将原始专栏作为第二个我...

回答 1 投票 0

使用 arrow-rs 加载数据时进行单热编码

在我的 Rust 项目中,我从 Mongo 加载文档并将它们反序列化为 serde_json 值: 匹配光标.deserialize_current() { 好的(d)=> { 让 doc = serde_json::to_value(&d).

回答 1 投票 0

类型错误:不可哈希类型:pd.get_dummies 的“系列”

我正在尝试对我拥有的数据框中的一些标称数据使用 pd.get_dummies (来自 Kaggle 的 House 回归)。我将所有名义类别分成列名称列表,'obj_nomin...

回答 1 投票 0

OneHotEncoding 数据集中的多列一次

考虑以下简单的片段数据集: 2 列:X、Y。 X 和 Y 列都只有 3 个可选类别值 我想对这些列进行编码。 我的尝试: 将 numpy 导入为 np 导入...

回答 2 投票 0

Pyspark one-hot 编码与分组相同的 id

有没有一种方法可以在 Spark 中执行 OHE 并“展平”数据集,以便每个 Id 只有一行? 例如,如果输入是这样的: +---+--------+ | id|类别| +---+--------+ | 0|一个| | 1| ...

回答 1 投票 0

tensorflow One Hot Encodings 的使用

我收到此功能的断言错误...我该如何解决这个问题 def one_hot_matrix(标签,深度=6): one_hot = tf.one_hot(标签、深度、轴 = 0) one_hot = tf.reshape(one_hot, (-1...

回答 3 投票 0

R 对分类变量级别低于训练数据的新数据进行预测

我需要对一些数据进行分类(R xgboost 或 catboost 等),这些数据共有大约 30 个输入变量。数据集变量之一是因子变量,有 100 个可能的级别(&qu...

回答 1 投票 0

OneHotEncoder 没有表现?

我获得了一个代码块,可以在 Jupyter 中运行来了解 One Hot Encoding,当我运行代码时,会出现错误。 从 sklearn.preprocessing 导入 OneHotEncoder 作为 ohc enc = ohc(drop='

回答 1 投票 0

如何在具有分类和数字特征的 pandas 数据帧上应用一种热编码?

一些特征是数字的,例如“学校毕业率”,而其他特征是分类的,例如学校名称。我在类别特征上使用了标签编码器...

回答 1 投票 0

如何制作一个单神经元神经网络?

我想制作一个像 w1x1+w2x2+w3*x3+b1 这样的单神经元函数 我的训练输入是 [1,0,0], [0, 1, 0], [0,0,1], [...

回答 1 投票 0

为什么 pd.get_dummies 返回布尔值而不是 0 1 的二进制值

我不知道为什么我的One-Hot编码代码; “pd.get_dummies”返回布尔值而不是 0 1 的二进制文件 df = pd.get_dummies(df) 编写以下代码行后; df...

回答 1 投票 0

如何在不将数据帧转换为数组的情况下执行一次热编码?

我有 df 数据框,其中包含分类特征列“temp_of_extremities”、“peripheral_pulse”、“mucous_membrane”。 我想对分类特征进行编码,如下所示: 从 sklearn.preprocessing 导入

回答 1 投票 0

sklearn 一种热编码。 ValueError:对于稀疏输出,所有列都应该是数字或可转换为数字

我是 sklearn 编码新手,我需要对 dtaset 的 3 列进行编码,我尝试仅对一列进行编码,但它向我发送了一个错误 *ValueError Traceback(最近的...

回答 1 投票 0

在 R 中高效解码多个热编码列

我有以下数据框: id = c(1,2,3) 其中_home = c(1, 0, NA) 其中_work = c(0, 1, NA) with_alone = c(0,0,0) with_parents = c(0,1,1) with_colleagues = c(1,1,0) 性别_男性 = c(1,0,1)

回答 1 投票 0

转换多个热编码列并转换为长格式

我有一个相当复杂的数据框架结构: ID = c(1,2,3) 会话 = c("2023-11-14 19:01:39+01:00", "2023-11-14 20:01:39+01:00", "2023-11-14 21:01:39+ 01:00") P_affe...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.