categorical-data 相关问题

统计数据类型,其值是固定数量的名义类别之一。

TypeError:使用 ColumnTransformer 时“ABCMeta”对象不可订阅

我读过很多关于这个话题的问题,但没有一个是我面临的同一个问题,也没有一个有我需要的答案。所以我希望有人至少可以对此有所了解。 我是

回答 0 投票 0

计算模态y在变量x中的权重比例的函数

我创建了两个函数。 计算模态 y 在变量 x 中所占比例的百分比函数, 计算数值变量 x 的平均值的 average 函数,...

回答 0 投票 0

只有分类变量的stata回归分析(因变量和预测变量都是分类变量)

希望你一切都好。 我有一个只有分类变量的数据集,如下所示: A。性别(0=男性,1=女性) b.年龄(18-29、30-39、40+) C。 edu_level (1=primary, 2=secondary, 3=master, 4=don'...

回答 0 投票 0

将数值和复杂分类数据与随机森林预测模型结合使用

我正在尝试使用数值和分类数据创建随机森林预测模型。我知道使用编码,分类数据可以转换为数值数据,但是你...

回答 1 投票 0

factors - 使用整数而不是 factors 的标签

我正在对具有因子变量的数据进行一些成对比较。这个变量有多个 7 个级别,每个级别都有一个标签(存储在属性中)。当我进行 pariwise 比较时......

回答 0 投票 0

如何将相同的 cat.codes 应用于 2 个不同的数据帧?

我有 2 个数据帧 X_train 和 X_test。这 2 个数据框具有相同的列。 有 1 列称为级别,需要将其从 str 更改为 int。但是,每个数据框的级别列 ...

回答 0 投票 0

如何在混合模型公式中只包含特定的因子值?

我是 Stack Overflow 的新手,提前致歉,因为这很可能是一个非常基本的问题,但是,根据下面的数据,我只想将几个治疗组纳入我的

回答 1 投票 0

连接数据帧时如何在 pandas multiindex 中保留类别 dtype?

我正在处理我希望能够控制排序顺序的数据(在我的实际用例中,染色体名称,但在这里我使用了虚拟名称),这将是 MultiIndex 的一部分(也包含

回答 0 投票 0

具有分类和数值变量的数据集中的异常值检测和删除

我正在使用心电图数据集,我创建了一个包含 9 个变量和分类 NSP 变量的数据集,但是当我删除异常值类别 2,3 时,NSP 变量中的 2,3 被删除了。何...

回答 0 投票 0

plyr软件包中分类变量的平均值。

我的分类变量,风险有三组。ADV,HHM和POV,我想得到的平均值这三个组 四个连续变量读.5,读.6,读.7和读.8,这是阅读...

回答 1 投票 0

如何删除具有特定值的行

我想删除城市列中包含 "New York "的行,我写了以下内容:mydata=mydata[(mydata['city']! 我写了以下内容:mydata=mydata[(mydata['city'] != 'New York')当我像下面这样查询时,我没有得到任何记录......

回答 1 投票 0

创建一个分类变量(年龄类别),并应用于一个表格。

我正在处理一个有许多变量的大表,包括 "年龄"。下面是我的表格的一个例子。年龄 Var2 Var3 Var4 Var5 32 John Green 已婚 6'1 47 Julia Stone... ...

回答 1 投票 0

在pandas中的get dummies中获取分类值的频率。

我在这里实现了一个热编码的数据版本Cluster_Size Hardware_type 1.0.4 3 Aplha,Alpha,Aplha 1.0.2 3 Aplha,Beta,Aplha 1.0.9 3 ...。

回答 1 投票 1

在Python中提取分类特征的嵌入回到原始数据框架中去

假设我有一个数据框,里面有几个数字变量和一个分类变量,有10000个类别。我使用神经网络与Keras得到分类变量的嵌入矩阵 ...

回答 1 投票 1

read.csv在R 4.0.0中似乎无法检测到因子。

我最近从R 3.5.1更新到了R 4.0.0。read.csv的行为似乎发生了变化 - 当我在R 4.0.0中加载.csv文件时,不会自动检测到因素,而是被识别为......

回答 2 投票 1

如何在pyspark中创建&按有序分类变量排序

我正在将一些代码从pandas迁移到pyspark。我的源数据框架是这样的: a b c 0 1 insert 1 1 2 update 1 2 3 seed 1 3 4 insert 2 4 5 update 2 5 6 ... ...

回答 1 投票 0

R将连续变量转换为分类变量

我有一列连续的数值(NO2),我需要将其转换为分类值。谁能解释一下下面的代码是如何实现的:cutpoints(切点)

回答 1 投票 0

Keras多级分类输入_形状大小问题。

我正在用Keras构建一个人脸检测AI。我以如下形式收集数据: dataset - a - b - c - d main.py 其中,a,b,c和d是每个包含图像的类。...

回答 1 投票 0

带有分类变量的RJAGS编译会导致索引超出范围错误

背景试图模拟一条铁路小径上的骑自行车的人,这比平日少了一个工作日。 mosaicData的RailTrail包含先锋谷规划局收集的数据...

回答 1 投票 1

如何编码和归类分类数据?

我有一列包含分类数据和一些nan值。我想填写nan值,而不是删除它们。一开始我真的不知道该怎么做-编码还是归因?我尝试首先使用...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.