统计数据类型,其值是固定数量的名义类别之一。
我已经重新创建了数据结构,因此它可以帮助我更好地理解我的问题。让我们生成一些数据。 一个<- c(10,20,30,40) b <- c('book', 'pen', 'textbook', 'pencil_case') c <- c(TRUE,
有人给了我一组列表,这些列表在一个列表中,在一个列表中,你明白了。首先,抱歉,我真的不知道如何给你数据来摆弄它,我不能把它...
我正在处理一个数据集,想使用序数回归模型来分析数据。自变量之一是年龄,范围为:18-24、25-34、35-44、45-54、55-64 和 65+。 我试过
图书馆(润滑) 图书馆(dplyr) 图书馆(suncalc) 这是我的数据的前 6 行的列表。我只为我正在尝试做的事情提取了必要的列。 结构(列表(Date.of.Capture = struct...
Suncalc R 包 - 如何使用日照时间制作分类变量?我的逻辑论证不起作用
我已经加载了这些库,不确定你是否需要它们,但肯定需要 suncalc。 图书馆(润滑) 图书馆(dplyr) 图书馆(suncalc) 这是我的数据的前 6 行的列表。我
使用 ggplot2 绘图:分类 y 轴上的“错误:提供给连续刻度的离散值”
下面的绘图代码给出错误:提供给连续刻度的离散值 这段代码有什么问题?它工作正常,直到我尝试更改比例所以错误就在那里......我试图弄清楚......
如果我在回归中使用二元解释变量,我如何告诉 R 使用某个水平作为参考? 它只是默认使用某个级别。 lm(x ~ y + as.factor(b)) 与 b {0, 1, 2, 3, ...
具有 5 个分类特征和 5 个数值特征且只有 1 个数值输出的优化问题
我想找到产生所需输出的分层复合材料的结构参数。 考虑一下我有一个分层结构。层数为5。每层的厚度为...
我正在重新调整一位同事编写的随机森林脚本的用途,该脚本使用空间变量和 caret 包运行模型的 100 次迭代,但该脚本最初并不是用分类数据编写的...
我正在尝试对分类数据和数字数据的混合运行 XGBoost。虽然我能够训练模型并进行预测,但我无法将模型输出转储到 df 或 json。相反,我得到了错误:...
我开发了一个 ML 模型,它可以根据预测变量集(x1、x2、x3 等)对某些目标进行可变 Y 分类。我的任务是以 HTML 形式创建某种“计算器”
使用 match.it 比较倾向得分匹配后分类结果和连续结果的分布
我使用match.it进行倾向得分匹配,使用cem方法进行生存分析。但是,我也有兴趣比较几个分类和连续(停留时间)
我有一个具有以下结构的数据框: 数据<- data.frame( values = c (2, 5, 6, 7, 4, 6, 8, 9, 6, 8, 10, 13), race = c("black", "bl...
我成功创建分类值后,它们的结果是NaN。 我使用了这个命令: df['Memory']= pd.cut(pd.to_numeric(df['RAM'], errors="coerce"), [0,4,8,12],
我需要为 RAM 类别创建分类变量。 基本:RAM [0-4] 中级:RAM [5-8] 高级:RAM [8-12] 命令: df['Memory']=pd.cut(df['RAM'], [0,4,8,12], include_lowest=True, la...
除了默认对比代码(contr.treatment / contr.sum / contr.helmert)之外,我还想在 R 中使用一些用户定义的对比。然而,我读过的指南表明这些......
这是我的代码: 超过 %>% 选择(circumstances_bite,circumstances_bite_broad)%>% drop_na() %>% ggplot(aes(y=fct_infreq(circumstances_bite), fill = circumstances_bite_broad))+
我试图了解两个或三个分类变量之间可能存在的不同类型的独立性。 你能提供三个边缘变量的真实世界示例吗
我写了这个函数来将一个只有观察到的类别组合的分类变量数据集转换成一个包含所有可能组合的数据集...
我在 R(和 tidyverse)中工作,数据来自包含 11 个问题的问卷,每个问题都以 4 分李克特量表回答: 低于正常 不超过正常 超过正常 更多...