因子是R语言中的数据类型,用于编码分类或枚举数据。
我面临着一个数据集问题,该数据集具有重叠的因子水平。我想按因子水平制作时间表,条形图和统计数据 - 但是,我希望因子水平为......
我有一个变量df1 $ StudyAreaVisitNote,我把它变成一个因子。但是当我将df1子集化到BS中时,这个变量并不是一个因素:在子集化数据上使用table()函数......
我有许多data.frames,每个都有一个因素。我想确保它们都使用相同的级别。这样做的正确方法是什么?在下面的代码中,您将看到我重新分配...
我有一个类似下面的数据框。我想在因子级别A1,A2,B1,B2中混合来自列V1,V2和V3的值。 ñ
我有这个代码片段:levels(testing [,c('is_top_rated_listing')])返回:NULL然而这段代码返回:levels(测试$ is_top_rated_listing)返回“0”“1”不幸的是我需要...
我正在使用我已下载的一组Fitbit数据,它有一个工作日列表,我正在尝试正确订购。现在,当前数据集没有“星期五”,但我希望这些因素......
使用具有正则表达式匹配的单个函数重新编码,折叠和顺序因子级别
我发现在R中操纵因子变量过于复杂。清洁因素时我经常想做的事情包括:度假水平 - 不仅要设置参考类别,还要放置所有......
我有一个只有一列的DF:DF $ A.这是一个具有名称的因素,我需要以特定的方式重新排序:l pheno l.ldl.a m.ldl.b s.ldl.c x.vldl.b l.vldl.c m.vldl.d s.vldl.f xs.vldl.h xxl.vldl ....
我有一个包含空白缺失值和NA的大型数据框。执行摘要(因子(df $ col))给了我类似A 123 B 50000 90000 C 26000 NA的12476(...
我必须根据另一个文件的日期/时间窗口从一个大文件中提取每个人的数据。我有ID,开始,结束日期作为我的窗口文件和一个巨大的文件(FULLDATA)与各种...
之前出现子集化时丢弃未使用的因子级别的问题。常见的解决方案包括通过声明选项(stringsAsFactors = FALSE)尽可能使用字符向量...
我试图将dataframedfin中的所有字符列转换为每个具有有效R名称级别的因子,使用lapplywithlevels,factorandmake.names在其参数中,如下所示:levels(df [,cols])
Python的.cat.codes的R等价物是什么,它将分类变量转换为整数级别?
在python中,您可以使用.cat.code为变量生成分类代码,例如df ['col3'] = df ['col3']。astype('category')。cat.code你在R中怎么做?
我试图这样做:(以下数据框只是为了表明这个想法)abc [1,] 1 1 2 [2,] 1 3 5 [3,] 2 2 4 [4,] 2 1 5其中'一个'是......
我正在使用GAM模型根据给定点的某些环境条件预测物种丰度。我已经创建了一个广义加法模型(GAM)来做这个并基于我的预测。 ...
plyr是否会跳过因子[即分组变量]的缺失级别?这是我诊断问题的第一个问题。我有一个数据集,其中患者处于分层=农村或阶层=城市。 ...
我有一个以下格式的数据框,我想得到交叉制表表:T1 T2 NN NF FF FF NF FF NN NN NN FF NF NF NF NF FF FF我可以创建一个简单的交叉制表...
我有一个类似于下面的data.frame。我通过删除我不感兴趣的行来预处理它。我的大多数列是'因素',其'级别'不会更新,因为我过滤data.frame。我可以 ...