categorical-data 相关问题

统计数据类型,其值是固定数量的名义类别之一。

#1类别变量的组合类别

我想结合来自错误编码的分类变量(partido_pref)的一些巴西政党名称。我想合并的类别是“ PC do B”和“ PCdoB”,...

回答 1 投票 0

有条件地在分类列中创建一个“其他”类别

我有一个带有一列的DataFrame df,使用下面的代码创建了类别:以pd格式导入大熊猫从字符串中以rand形式随机导入兰特ascii_uppercase rand.seed(1010)df = pd.DataFrame()值= ...

回答 2 投票 2

Cox比例风险模型中的相互作用:对比和两个分类因素之间的问题

我需要帮助,以了解R中的coxph()函数如何工作,从而如何正确解释输出。我尝试在“生存分析”数据集上运行cox比例风险模型...

回答 1 投票 0

如何在使用Python的机器学习中处理大量分类数据?

我有一个具有100000行的汽车数据集。该列是“制造商”,这是输出的重要方面,因此我不能删除它。我应该如何处理此问题?

回答 1 投票 -1

具有分类预测变量的Seattle Catplot错误

我正在使用一个数据集,该数据集具有一个分类预测变量(具有值East Coast或West Coast)和一个因变量(Minutes)。这是CSV文件:https://drive.google.com/file / ...

回答 1 投票 0

如何在Matlab中的其他向量中创建一个依赖于布尔值的向量

我想根据另一个向量的值创建一个新的分类向量。其中每个观察仅针对一个向量为真,例如v1 v2 v3 0,1,0 1,0,0 1,0,0所以我想要v4 ...

回答 2 投票 0

使用Tidyverse在R中将连续变量重新编码为具有*特定类别的类别

[第一次问一个问题,但我会尝试按书讲:)这个问题很简单,但是我在SO的任何地方都找不到我想要的东西。我发现这个有用的答案...

回答 1 投票 0

获得分类变量R的唯一值

我如何知道每个变量从分类值的数据框中获取多少个唯一值,然后获得包含这些信息的ggplot? R Studio中的所有这些]]

回答 1 投票 0

如何使用深度学习在python jupyter笔记本中解决此问题

我正在尝试跑步。但是会发生此错误TypeError:int()参数必须是字符串,类似字节的对象或数字,而不是'NoneType'。这是代码数据= np.asarray(data,dtype =“ float”)/ 255.0 ...

回答 1 投票 0

分类变量R estudio中的唯一值

我如何找出每个分类在一个数据框中要使用多少个唯一值,然后用图形表示它? R studio中的所有这些]]

回答 1 投票 0

statsmodels中的类别交互?

在R中,我有一个带有两个分类预测变量的数据框,其中一个具有多个级别,并且有一个分类响应。我在每个分类上运行多项式逻辑回归...

回答 1 投票 0

如何根据需要将每个分类唯一值编码为数值?

如何根据需要将每个分类唯一值编码为数值? HeatingQC:加热质量和条件Ex优异Gd良好TA平均/典型Fa Fair Po Poor ...

回答 1 投票 0

为高基数数据实现Scikit Learn的FeatureHasher

背景:我正在对健康保险索赔进行二进制分类。我正在使用的数据大约有100万行,并且包含数字特征和分类特征(所有...

回答 1 投票 0

是否可以确定数据集中有多少行针对多个条件(列)具有相同的分类变量?

例如,我有下面的数据集,其中1 =是,0 =否,我需要弄清楚固定电话拨打了多少电话,通话持续了不到10分钟。示例数据集的图像

回答 3 投票 0

x轴上多个变量的散点图

我想为在不同列中定义的多个变量创建散点图。样本输入:df = structure(list(section = structure(1:6,.Label = c(“ a”,“ b”,“ c”,“ d”,“ e”,“ f”),class =“ ...

回答 1 投票 0

丢弃多级分类变量回归R

我正在进行逻辑回归,我的自变量之一是分类的(年份:2010、2012、2016)。我将2010设置为参考变量。但是当我运行回归时,输出...

回答 1 投票 1

Python将混合因子级别强制转换为字符串

我在Pandas数据框中有一个具有以下唯一因子级别的列:My_Factor_Levels = [9.0,0,6.0,'9','6',9,6,'DE','3U','9.0 ','6Z','6.0','9。','6。','3B','1U','...

回答 1 投票 1

通过R中的其他变量分组时,发现每组具有多个唯一值的列

例如,我有一个数据集(我的真实数据集有数百个列和数百万个观测值):>数据time_period国家var1 var2 var3 1:2000_Q2美国四月春季...

回答 1 投票 1

如何使用目标编码:在测试集上扩展均值

扩展均值是一种在执行目标编码时防止过度拟合的方法。但是我不明白的是如何使用这种技术在火车上进行拟合并在测试上进行变换...

回答 1 投票 0

Pandas数据框使用分类数据创建Seaborn水平条形图

我目前正在使用这样的数据框:我想要显示的是Victory列的总编号,其中值按AGE_GROUP分组为S,按GENDER进行差分,类似于...]]]

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.