categorical-data 相关问题

统计数据类型,其值是固定数量的名义类别之一。

Python pandas通过枚举类值对数据框进行排序

如果我有枚举类:从枚举导入,枚举类Colors(Enum):RED = 1 ORANGE = 2 GREEN = 3并且如果我有一个数据框,其中的一栏是color(可以小写):>>> ...

回答 2 投票 0

如何将分类变量转换为R中的连续变量?

我有一个DataFrame,其中包含许多变量,例如百分比,年,公顷等,但是我有一个是距离,我正在评估直接影响(直接影响的面积)和...的程度...]]

回答 1 投票 0

是否有针对具有超过500个不同值的分类变量的编码技术?

我有一个名为'activityNum'的分类列,这对于预测数据集中的'数量'非常重要。 activityNum在数据集中具有500多个值。值的格式为'AP ....

回答 2 投票 -1

在Excel中为虚拟数组的分类列

我正在尝试将机器学习模型转换为excel,以便数据分析人员可以交互地使用它。我想将分类变量转换为虚拟表示形式:WeekDay ...

回答 2 投票 0

自动编码器对数据的特征/类别进行编码

我的问题是关于自动编码器的使用(在PyTorch中)。我有一个具有10个不同类别的分类特征的表格数据集。这些类别的名称完全不同-...

回答 1 投票 0

read.csv似乎未检测到R4.0.0中的因素

我最近从R 3.5.1更新到R 4.0.0。 read.csv的行为似乎已更改-当我在R 4.0.0中加载.csv文件时,不会自动检测到因子,而是将其识别为...

回答 1 投票 1

如何有效地计算类别属性的类别(250)? PostgreSQL或Python

我有一个具有50个属性(8个分类)的大数据库,我需要创建一个摘要,其中包含按城市和州分组的每个变量的所有类别的计数。属性之一具有超过250个...

回答 1 投票 0

做groupby.median()时如何保存分类列?

我有信用贷款数据,但是原始df有许多可以位于一个客户之下的贷款ID。因此,我需要按客户端ID分组以构建客户端配置文件。原始df:contract_id','...

回答 1 投票 0

如何将行保留在分类数据中?

我有一个动物收容所的数据集,其中参数“品种”具有50多种不同的可能性。我查看了数据汇总,共有4个品种占主导地位。我的...

回答 2 投票 -1

用于分类特征的聚合函数group_by

[在每天的购买记录中,我想应用一个聚合函数,以[]“ Bananas”,“ Apples”,“ Coke”,“。”给定的任意顺序保留一天中最重要的交易。 。

回答 1 投票 1

获得大熊猫假人的分类总和

我正在此处对数据版本Cluster_Size Hardware_type 1.0.4 3 Aplha,Alpha,Aplha 1.0.2 3 Aplha,Beta,Aplha 1.0.9 3 ...实施一种热编码。

回答 1 投票 0

如何绘制值计数并显示熊猫的值标题?

我有一个df栏,地址为“出生地”。地址是类别。 sns.countplot(df_defaulted ['birn_addr_area']。value_counts())但我需要在每个栏下方垂直显示地址。怎么做?

回答 1 投票 0

按列中的值添加百分比列

我正在尝试将分类列值编码为百分比频率(二进制编码),作为新功能。值计数频率(%)20190 14723 16.2%20100 11235 12.4%20120 9449 10.4%...

回答 1 投票 0

将数字输出标签转换为keras中的分类向量

[我正在Keras中创建一个深度学习多分类模型,并且已经将输出标签训练集y_train从1到14的数值转换为如下所示的输出向量...

回答 1 投票 0

当我们混合数据时如何用K-means聚类方法处理分类数据?

我正在使用k均值方法根据建筑物的能耗,面积(以平方米为单位)和所在位置的气候带对它们进行聚类。气候区是一个类别变量。值可以是A,B,C ...

回答 3 投票 -1

具有ggplot的分类X轴中不同组的连接点

我正在尝试说明三种方法之间A,B和C的丰度变化。 A,B和C也分为两组(“ X”和“ Y”)。我试图用ggplot绘制这些图并连接...

回答 1 投票 0

在Excel中为虚拟数组的分类列

我正在尝试将机器学习模型转换为excel,以便数据分析人员可以交互地使用它。我想将分类变量转换为虚拟表示形式:WeekDay ...

回答 2 投票 0

您是否应该在基于树的模型中缩放数字分类特征?

我正在缩放基于树的分类器的数据,我知道这是没有必要的(但也不应该受到伤害)。我的大部分功能都是定量的,但我还有“ day_of_week”,剩下的是0-6(不是...

回答 1 投票 0

为什么与MatchIt R软件包进行精确匹配,找到具有2个不同级别的分类变量的匹配对?

我实际上正在处理金枪鱼标签捕获数据。我想在两组个人之间取得平衡,在参考区域(治疗组)中标记的个体与在...

回答 1 投票 0

sklearn随机森林分类器可以处理类别变量吗?

我从2014年开始发现此线程,答案指出,不,sklearn随机森林分类器无法处理分类变量(或至少不能直接处理)。答案在2020年有变化吗?我想...

回答 1 投票 2

© www.soinside.com 2019 - 2024. All rights reserved.