categorical-data 相关问题

统计数据类型,其值是固定数量的名义类别之一。

使用ggplot R将条形图和折线图与数字和分类变量相结合

我正在尝试使用连续和分类变量在ggplot中组合条形图和线图。我基本上需要做这样的事情:到目前为止我已经有了这个代码:ggplot(data = nutrient,aes(...

回答 1 投票 2

为数据框中的因子添加额外级别

我有一个包含数字和有序因子列的数据框。我有很多NA值,因此没有为它们分配级别。我将NA更改为“无应答”,但因子列的级别不包含...

回答 7 投票 21

R:当我用测试数据预测时,因子为新水平

我从我的数据集中得到一个错误类似的逻辑与我在下面发布的代码。我曾尝试增加训练数据的数量,但没有解决。我已经排除了所有NA值。 ...

回答 3 投票 2

R中的分类变量

我已将CSV中的一些数据导入R,并希望将多个列从“文本”转换为分类变量。例如,如果我有以下列:产品产品A ......

回答 2 投票 0

catboost R分类转换为数字

如果我有一个数据框,比如第1列和第2列中的因子以及第3列中的标签,那么:train_pool之间是否有任何区别

回答 1 投票 0

Panda DataFrames中最少的有序分类数据

我有一个Pandas DataFrame,其中一个Serie包含有序的分类数据。这个意甲的一些价值可能会丢失(NaN)。我想在不考虑NaN的情况下获得最低限度,但我获得了......

回答 1 投票 2

Probit回归:分类变量的边际效应?

我在R中运行了一个概率回归。该模型混合了一些连续和分类变量(编码为因子)。我想计算每个变量的边际效应。为此,我使用命令...

回答 1 投票 0

隔离林:分类数据

我正在尝试使用sklearn中的Isolation Forest来检测乳腺癌数据集中的异常。我正在尝试将Iolation Forest应用于混合数据集,当我拟合模型时会给我值错误。...

回答 1 投票 2

修复Pandas中的重叠类别

我有一个数据集,其中包含描述范围的分类特征。此功能的类别是有序值范围。然而,在这个特定的数据集中,有一个类别......

回答 1 投票 1

R:将dgCMatrix拆分为训练和测试矩阵,用于XGBoost训练

首先,我是XGBoost的新手。所以请原谅我的愚蠢。这是一个问题:如何将dgCMatrix分成两个矩阵(比如火车和测试)?我的目标是将这些矩阵用于XGBoost ......

回答 1 投票 2

如何在python中检查连续变量和分类变量之间的相关性?

我有一个数据集,包括分类变量(二进制)和连续变量。我正在尝试应用线性回归模型来预测连续变量。有人可以让我知道......

回答 1 投票 6

如何将TF Tensor保持值转换为Tensor保持分类值

我正在削减TFRecords,它为我提供了一个标签作为数值。但是当我正在阅读原型记录时,我需要将此值转换为分类向量。我怎样才能做到这一点。这是...的代码片段

回答 1 投票 0

分类数据:通过添加新维度转换为二进制编码

我的数据集中的每个特征都有三个类别,目前使用整数0,1和2进行编码。我想将其编码为二进制类型的编码,其中0替换为[...

回答 1 投票 0

多个分类变量(熊猫)之间的相关性

我有一个由22个分类变量组成的数据集(非有序)。我想在一个漂亮的热图中可视化它们的相关性。由于pandas内置函数DataFrame.corr(method ='pearson',...

回答 3 投票 2

使用R中分类数据的圆形移动窗口计算多数

我正在尝试计算R中分类栅格数据集中的多数值,例如使用土地覆盖数据。这与使用大多数的ArcGIS中的焦点统计工具类似...

回答 1 投票 0

Pandas将所有对象列强制转换为类别

我希望ha优雅函数将pandas数据框中的所有对象列转换为类别df [x] = df [x] .astype(“category”)执行类型转换df.select_dtypes(include = ['object'] ) 将 ...

回答 2 投票 2

Tensorflow如何处理一列内多个输入的分类特征?

例如,我有以下csv格式的数据:csv col0 col1 col2 col3 1 A E | A | C 3 0 B D | F 2 2 C | 2用逗号分隔的每列代表一个功能。 ...

回答 1 投票 2

如何使用sharex = True对catplot(kind ='violin')顶部的seaborn catplot(kind ='count')进行子绘图

到目前为止,我已经尝试了以下代码:#import来处理绘制导入seaborn作为sns #Import pyplot,figure inline,set style,plot pairplot import matplotlib.pyplot as plt#make figure ...

回答 2 投票 3

在R中的回归之前自动识别变量已被分解

我想写自己的预测函数,但是面临一些问题。起初我写了一个逻辑回归的代码。在运行逻辑回归之前,您必须手动分解...

回答 1 投票 1

eval中的错误(family $ initialize):y值必须为0 <= y <= 1

教科书中提到我需要将卫星数据转换为零和1(如果Y = 0,则Y = 0.但如果Y大于或等于1,则Y = 1),但我不知道我知道怎么做。我......

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.