categorical-data 相关问题

统计数据类型,其值是固定数量的名义类别之一。

dplyr 使用条件值 AND OR 进行变异以创建组类别

我有一个数据集,其中有一个名为“个体”的变量,有很多选项,就像这样。 我对某一天对不同个体 (Individual_ID) 的观察结果 不同的选择...

回答 1 投票 0

是否可以使用pandas的read_csv读取分类列?

我尝试使用 read_csv 作为 dtype={n: pandas.Categorical} 传递 dtype 参数,但这无法正常工作(结果是一个对象)。说明书不清楚。

回答 2 投票 0

导入csv文件并更改某些值的名称

好吧,我的问题是我想导入一个 csv 文件(用逗号分隔,所以 R 将其读取为数据帧)。 第一栏叫“动物”,下面是“鳄鱼...

回答 1 投票 0

为什么我的“小于”和“大于”命令中不包含两位数?

我对 R 相当陌生,我正在将它用于我的论文。我尝试创建一组命令,将一系列数值重新编码为分类变量。我的数据集中可能值的范围

回答 1 投票 0

当变量每个案例多次出现时比较组

首先,我承认,我在其他地方问过这个问题(交叉验证),但我想阅读两个论坛的人不一定是同一个人。 我正在完成一篇手稿,但有一个困扰我的问题

回答 1 投票 0

如何使用OrdinalEncoder()设置自定义顺序?

我的二手车价格预测数据集中有一列名为“Owner_Type”。它有四个唯一值,即['第一'、'第二'、'第三'、'第四']。现在是最赚钱的顺序...

回答 1 投票 0

按 CategoricalDtype 顺序对图进行排序

目标是按顺序可视化每个组的箱线图。组为 pd.CategoricalDtype 且有序。 我没能设法遵守命令。相反,它仅按字母顺序排序。 小鬼...

回答 1 投票 0

R 中分类变量的两个以上水平的显着性测试

我试图确定两组之间具有 8 个水平的分类变量的频率是否存在显着差异。在这种情况下,两组被问到他们最喜欢的颜色,答案是 8

回答 1 投票 0

多个分类变量之间的相关性

我有一个由 22 个分类变量(无序)组成的数据集。我想在一个漂亮的热图中可视化它们的相关性。由于Pandas内置函数 DataFrame.corr(method='pearson',

回答 4 投票 0

pd.Categorical 和 pd.api.types.CategoricalDtype 之间的区别

我不明白pd.Categorical和pd.api.types.CategoricalDtype之间的区别。后者返回 CategoricalDType 实例,前者返回 Category 实例。什么是

回答 1 投票 0

Pandas:将类别转换为数字

假设我有一个包含国家/地区的数据框,如下所示: 抄送 |温度 美国 | 37.0 加州 | 12.0 美国 | 35.0 非盟 | 20.0 我知道有一个 pd.get_dummies 函数可以将国家/地区转换为“one-hot encod”...

回答 6 投票 0

在 y 轴上重新排序重新标记的数据

我有一个数据集,其中 x 是元组整数: [1,2,3,4,5,6,7,8,9,10,...40] y 是一个字符串元组 ['5', '2', '5', '2', '5', '2', '5', '2', '5', '2', '5', '2', ' 5'、'2'、'4'、'2'、'4'、'2'、'5'、'1'、...

回答 1 投票 0

在Python中重新排序y轴上重新标记的数据

我有一个数据集,其中 x 是元组整数: [1,2,3,4,5,6,7,8,9,10,...40] y 是一个字符串元组 ['5', '2', '5', '2', '5', '2', '5', '2', '5', '2', '5', '2', ' 5'、'2'、'4'、'2'、'4'、'2'、'5'、'1'、...

回答 1 投票 0

如何测试这两个回归模型是否基本等效?

我想测试/证明两个回归是否本质上是相同的。 但首先,使其成为一个可重现的示例。 为每个因子变量创建水平 级别_a <- c("A1", &q...

回答 1 投票 0

根据有序分类比较分类变量的两个元素

在Python中,我创建了一个像这样的分类变量: x = pd.Categorical(["Hi", "Lo", "Med", "Zer", "Lo", "Zer", "Lo", "Hi...

回答 1 投票 0

序数编码或 One-Hot 编码

如果我们不确定分类特征的性质,例如它们是名义特征还是序数特征,我们应该使用哪种编码?序数编码还是单热编码? 有没有明确的规定...

回答 1 投票 0

处理电信数据流失预测模型中的分类缺失数据

我正在研究一个电信数据集,我需要拟合一个模型来预测客户流失(是或否)。有大量分类数据存在缺失值(总计 7043 个)。最好的方法是什么

回答 1 投票 0

替换分类数据中的缺失值

假设我有一列包含分类数据“红色”“绿色”“蓝色”和空单元格 红色的 绿色的 红色的 蓝色的 南 我确定 NaN 属于红绿蓝,我应该用 av 替换 NaN...

回答 3 投票 0

有什么方法可以获取Python pandas中标签编码器的映射吗?

我使用以下代码将字符串转换为数据集中的分类值。 data['weekday'] = pd.Categorical.from_array(data.weekday).labels 例如, 指数工作日 0

回答 11 投票 0

分类数据不能 >1 维

以下命令表示我的分类数据不能>一维。 我的分类变量是:law_lag(美国一些州法律的生效年份)、年份和

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.