categorical-data 相关问题

统计数据类型,其值是固定数量的名义类别之一。

如何强制 R 在回归中使用指定的因子水平作为参考?

如果我在回归中使用二元解释变量,我如何告诉 R 使用某个水平作为参考? 它只是默认使用某个级别。 lm(x ~ y + as.factor(b)) 与 b {0, 1, 2, 3, ...

回答 6 投票 0

具有 5 个分类特征和 5 个数值特征且只有 1 个数值输出的优化问题

我想找到产生所需输出的分层复合材料的结构参数。 考虑一下我有一个分层结构。层数为5。每层的厚度为...

回答 0 投票 0

从随机森林模型(分类变量)中提取变量重要性值的问题

我正在重新调整一位同事编写的随机森林脚本的用途,该脚本使用空间变量和 caret 包运行模型的 100 次迭代,但该脚本最初并不是用分类数据编写的...

回答 0 投票 0

带有分类变量的 XG Boost 模型转储

我正在尝试对分类数据和数字数据的混合运行 XGBoost。虽然我能够训练模型并进行预测,但我无法将模型输出转储到 df 或 json。相反,我得到了错误:...

回答 0 投票 0

如何使用烧瓶“处理”分类变量?

我开发了一个 ML 模型,它可以根据预测变量集(x1、x2、x3 等)对某些目标进行可变 Y 分类。我的任务是以 HTML 形式创建某种“计算器”

回答 0 投票 0

使用 match.it 比较倾向得分匹配后分类结果和连续结果的分布

我使用match.it进行倾向得分匹配,使用cem方法进行生存分析。但是,我也有兴趣比较几个分类和连续(停留时间)

回答 0 投票 0

垂直点显示同一地块中几个组的分布

我有一个具有以下结构的数据框: 数据<- data.frame( values = c (2, 5, 6, 7, 4, 6, 8, 9, 6, 8, 10, 13), race = c("black", "bl...

回答 1 投票 0

创建箱线图时的 Python 分类变量 NaN

我成功创建分类值后,它们的结果是NaN。 我使用了这个命令: df['Memory']= pd.cut(pd.to_numeric(df['RAM'], errors="coerce"), [0,4,8,12],

回答 0 投票 0

Python 创建分类变量错误

我需要为 RAM 类别创建分类变量。 基本:RAM [0-4] 中级:RAM [5-8] 高级:RAM [8-12] 命令: df['Memory']=pd.cut(df['RAM'], [0,4,8,12], include_lowest=True, la...

回答 1 投票 0

为什么 R 中的用户定义对比度需要作为权重的逆矩阵提供?

除了默认对比代码(contr.treatment / contr.sum / contr.helmert)之外,我还想在 R 中使用一些用户定义的对比。然而,我读过的指南表明这些......

回答 1 投票 0

如何在 ggplot 中将“填充”变量的条形排列在一起?

这是我的代码: 超过 %>% 选择(circumstances_bite,circumstances_bite_broad)%>% drop_na() %>% ggplot(aes(y=fct_infreq(circumstances_bite), fill = circumstances_bite_broad))+

回答 1 投票 0

独立性例子的类型

我试图了解两个或三个分类变量之间可能存在的不同类型的独立性。 你能提供三个边缘变量的真实世界示例吗

回答 0 投票 0

如何提高一个函数的效率

我写了这个函数来将一个只有观察到的类别组合的分类变量数据集转换成一个包含所有可能组合的数据集...

回答 2 投票 0

从应用于存储为因素的数据的评分系统中计算“总”变量

我在 R(和 tidyverse)中工作,数据来自包含 11 个问题的问卷,每个问题都以 4 分李克特量表回答: 低于正常 不超过正常 超过正常 更多...

回答 1 投票 0

如何更改 plot(allEffects()) 中分类 x 轴变量的顺序以进行线性回归?

我的整体数据框被命名为“Cohort_new”。我有一个线性回归,其中我的预测变量 (COI) 被分成标记为“非常低”、“低”、&

回答 0 投票 0

R ggplot 比较相似(但不相同)的分类数据列

我有一个看起来像这样的数据集: 平台 twitter_context facebook_context insta_context 推特 井号 北美 北美 Facebook 北美 脸书群组 北美 Instagram的 北美 北美 人士 Instagram的 N...

回答 1 投票 0

如何强制 R 在回归中使用指定的因子水平作为参考?

如果我在回归中使用二元解释变量,我如何告诉 R 使用某个水平作为参考? 它只是默认使用某个级别。 lm(x ~ y + as.factor(b)) 与 b {0, 1, 2, 3, ...

回答 6 投票 0

使用 LSTM 和 keras 进行时间序列预测的分类变量

我有一个 LSTM 模型 (keras),它接收 6 个变量的过去 20 个值作为输入,并预测其中 3 个变量的未来 4 个值。换句话说,我有 6 个时间序列,我正在尝试

回答 2 投票 0

长数据文件:创建新的因子变量以识别因子变量随时间的变化

我在 R 中使用一个长格式数据文件,其中包含按参与者 ID 分组的三个时间点的性别认同。 示例文件在这里: 自由<- data.frame(id = as.factor(c(1,1,1,2,2,3,4,4,5,5,...

回答 0 投票 0

如何将分类数据转换为索引并打印作业?

上下文 我有一个分类数据系列。我的目标是将其转换为上例中的索引。但是,还有两个其他要求: nan 值应该保持 nan 而不是转换......

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.