categorical-data 相关问题

统计数据类型,其值是固定数量的名义类别之一。

有没有办法将图像放在使用分类数据的散景图中?

我试图在散景中的现有分类图表中添加水印。我试图通过多种方法添加图像,但还没有能够让它工作。我试过用...

回答 1 投票 0

我在使用Prototyping聚类算法进行聚类时出错,用于聚类分类和数值数据

所以我使用KProtoypes聚类算法来聚类包含分类和数字列的混合变量。我收到一个错误:'>'不支持...

回答 2 投票 0

sklearn category_encoders中的TargetEncoder和BinaryEncoder是什么?

我一直在寻找一种矢量化分类变量的方法,然后我遇到了category_encoders。它支持多种分类方法。我试过TargetEncoder和BinaryEncoder但是...

回答 1 投票 0

R错误“总和对因素无意义”

我有一个名为rRna_RDP_taxonomy_phylum的文件,其中包含以下数据:364“Firmicutes”39.31 244“Proteobacteria”26.35 218“Actinobacteria”23.54 65“Bacteroidetes”......

回答 1 投票 17

Lavaan - CFA - 分类变量 - 最后一个阈值很奇怪

我想用R中的lavaan执行多组CFA。我有几个分类变量,一些变量包含11个类别。所以这些变量将有10个阈值。在结果中......

回答 2 投票 1

在Python中使用非常多的组进行Anova测试

我有一个相对较大的数据集(大约273,744条记录),其中包含人的名字和他们使用的屈光力:名字|屈光度|性别|镇| ---------------------------------...

回答 1 投票 1

用于二进制编码(非单热编码)分类数据的Keras自定义丢失函数

我需要帮助为Keras编写自定义丢失/度量函数。我的类别是二进制编码(不是一热的)。我想在真实类和预测类之间进行逐位比较。 ...

回答 2 投票 3

逻辑回归系数没有意义

我正在尝试为电信流失建立逻辑回归模型。一些背景:为了预测客户流失我们的数据集包含有关变量的数据,如Account_Age,Current_Bill_Amount,Avg_Days_Delinquent(Days ...

回答 1 投票 0

LightGBM适合抛出“ValueError:检测到循环引用”,带有来自pd.cut的分类特征

我一直非常满意地使用lightGBM模型,因为我有大量的数据集,有数十个特征和数百万行,有很多分类列。我喜欢lightGBM可以得到的方式......

回答 1 投票 2

获得R中先前的序数因子水平

我必须在这个问题上遗漏一些东西,因为它看起来很简单并且已经有太多时间了。假设我们在数据帧中有一个序数因子列。我们想要一个新专栏......

回答 1 投票 0

将连续变量转换为二进制变量

我试图使用cut函数将连续变量转换为R中的分类变量的二进制列。代码是xyz = rnorm(20,3,1)xcut = cut(xyz,breaks = c(2,3))这转换...

回答 2 投票 1

如何在另一个数据框上通过类似vlookup的过程创建新的pandas列

我有一个看起来像这样的数据框。它将用于使用两个分类变量映射值。也许把它转换成字典会更好。第二个数据框非常大,有......

回答 1 投票 0

如何使用spss语法在输出中显示分类标签的数值

当我们在SPSS语法中创建表或频率时,我想知道是否有办法显示附加到名义变量类别的数值。我想用点东西......

回答 1 投票 2

在AAA中将AAA BB CC等信用评级列转换为AAA = 1,BB = .75等数字类别?

对于跨行的许多公司,我在数据框中有一个名为“CREDIT RATING”的列。我需要为AAA(DD)等评级分配数字类别,从1(AAA)到0(DDD)。快点......

回答 3 投票 -1

使用LASSO进行子集选择涉及分类变量

我在具有多个分类变量的数据集上运行了LASSO算法。当我在自变量上使用model.matrix()函数时,它会自动为每个因子创建虚拟值...

回答 1 投票 2

为具有相同级别的不同因子创建虚拟变量

我有一个数据集,其中包含我尝试格式化的大多数分类变量(因子)。数据集目前的格式如下:Obs X1 X2 X3 X4 ... X50 1 A B C D 2 B A D ...

回答 1 投票 0

在R中绘制分类变量(x)与连续变量(y)的关系图

请问有人可以帮助我绘制数据所需的R代码吗?我一直在努力工作几个小时,在网上搜索,我真的很挣扎。这是我的数据的一个例子......

回答 1 投票 -1

Python的.cat.codes的R等价物是什么,它将分类变量转换为整数级别?

在python中,您可以使用.cat.code为变量生成分类代码,例如df ['col3'] = df ['col3']。astype('category')。cat.code你在R中怎么做?

回答 2 投票 1

从连续的datetime变量中创建分类变量

我试图从连续的日期时间变量中创建一个分类变量。基本上如果它们在15到25之间,那么Age_category = 1,如果它们在25到35之间,那么Age_category = 2. ...

回答 1 投票 1

将具有虚拟变量的数据框转换为分类变量

我需要将虚拟转换为分类变量。作为R的新手,我只知道如何做到这一点。有人能指出我正确的方向吗?数据框是:数据

回答 3 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.