categorical-data 相关问题

统计数据类型,其值是固定数量的名义类别之一。


R - 将列表中的多个数据框转换为数字

我已经重新创建了数据结构,因此它可以帮助我更好地理解我的问题。让我们生成一些数据。 一个<- c(10,20,30,40) b <- c('book', 'pen', 'textbook', 'pencil_case') c <- c(TRUE,

回答 0 投票 0

R - 将列表中的多个列表转换为数字

有人给了我一组列表,这些列表在一个列表中,在一个列表中,你明白了。首先,抱歉,我真的不知道如何给你数据来摆弄它,我不能把它...

回答 0 投票 0

将年龄段范围转换为数值

我正在处理一个数据集,想使用序数回归模型来分析数据。自变量之一是年龄,范围为:18-24、25-34、35-44、45-54、55-64 和 65+。 我试过

回答 0 投票 0

如何使我的逻辑论证有效?代码没问题,但还是不行

图书馆(润滑) 图书馆(dplyr) 图书馆(suncalc) 这是我的数据的前 6 行的列表。我只为我正在尝试做的事情提取了必要的列。 结构(列表(Date.of.Capture = struct...

回答 1 投票 0

Suncalc R 包 - 如何使用日照时间制作分类变量?我的逻辑论证不起作用

我已经加载了这些库,不确定你是否需要它们,但肯定需要 suncalc。 图书馆(润滑) 图书馆(dplyr) 图书馆(suncalc) 这是我的数据的前 6 行的列表。我

回答 0 投票 0

使用 ggplot2 绘图:分类 y 轴上的“错误:提供给连续刻度的离散值”

下面的绘图代码给出错误:提供给连续刻度的离散值 这段代码有什么问题?它工作正常,直到我尝试更改比例所以错误就在那里......我试图弄清楚......

回答 3 投票 0

如何强制 R 在回归中使用指定的因子水平作为参考?

如果我在回归中使用二元解释变量,我如何告诉 R 使用某个水平作为参考? 它只是默认使用某个级别。 lm(x ~ y + as.factor(b)) 与 b {0, 1, 2, 3, ...

回答 6 投票 0

具有 5 个分类特征和 5 个数值特征且只有 1 个数值输出的优化问题

我想找到产生所需输出的分层复合材料的结构参数。 考虑一下我有一个分层结构。层数为5。每层的厚度为...

回答 0 投票 0

从随机森林模型(分类变量)中提取变量重要性值的问题

我正在重新调整一位同事编写的随机森林脚本的用途,该脚本使用空间变量和 caret 包运行模型的 100 次迭代,但该脚本最初并不是用分类数据编写的...

回答 0 投票 0

带有分类变量的 XG Boost 模型转储

我正在尝试对分类数据和数字数据的混合运行 XGBoost。虽然我能够训练模型并进行预测,但我无法将模型输出转储到 df 或 json。相反,我得到了错误:...

回答 0 投票 0

如何使用烧瓶“处理”分类变量?

我开发了一个 ML 模型,它可以根据预测变量集(x1、x2、x3 等)对某些目标进行可变 Y 分类。我的任务是以 HTML 形式创建某种“计算器”

回答 0 投票 0

使用 match.it 比较倾向得分匹配后分类结果和连续结果的分布

我使用match.it进行倾向得分匹配,使用cem方法进行生存分析。但是,我也有兴趣比较几个分类和连续(停留时间)

回答 0 投票 0

垂直点显示同一地块中几个组的分布

我有一个具有以下结构的数据框: 数据<- data.frame( values = c (2, 5, 6, 7, 4, 6, 8, 9, 6, 8, 10, 13), race = c("black", "bl...

回答 1 投票 0

创建箱线图时的 Python 分类变量 NaN

我成功创建分类值后,它们的结果是NaN。 我使用了这个命令: df['Memory']= pd.cut(pd.to_numeric(df['RAM'], errors="coerce"), [0,4,8,12],

回答 0 投票 0

Python 创建分类变量错误

我需要为 RAM 类别创建分类变量。 基本:RAM [0-4] 中级:RAM [5-8] 高级:RAM [8-12] 命令: df['Memory']=pd.cut(df['RAM'], [0,4,8,12], include_lowest=True, la...

回答 1 投票 0

为什么 R 中的用户定义对比度需要作为权重的逆矩阵提供?

除了默认对比代码(contr.treatment / contr.sum / contr.helmert)之外,我还想在 R 中使用一些用户定义的对比。然而,我读过的指南表明这些......

回答 1 投票 0

如何在 ggplot 中将“填充”变量的条形排列在一起?

这是我的代码: 超过 %>% 选择(circumstances_bite,circumstances_bite_broad)%>% drop_na() %>% ggplot(aes(y=fct_infreq(circumstances_bite), fill = circumstances_bite_broad))+

回答 1 投票 0

独立性例子的类型

我试图了解两个或三个分类变量之间可能存在的不同类型的独立性。 你能提供三个边缘变量的真实世界示例吗

回答 0 投票 0

如何提高一个函数的效率

我写了这个函数来将一个只有观察到的类别组合的分类变量数据集转换成一个包含所有可能组合的数据集...

回答 2 投票 0

从应用于存储为因素的数据的评分系统中计算“总”变量

我在 R(和 tidyverse)中工作,数据来自包含 11 个问题的问卷,每个问题都以 4 分李克特量表回答: 低于正常 不超过正常 超过正常 更多...

回答 1 投票 0
热门问答
最新问题