因子是R语言中的数据类型,用于编码分类或枚举数据。
我有一个df,其中value表示药物的状态:g1 = data.frame(drug = c('a','a','a','d','d'),value = c('fda ',''审判','案件','案件','前'))药物价值1 a fda 2 a trial ...
标题说明了一切。我在互联网上搜索了很多,但我找不到答案。本主题“为因子变量制作频率直方图”正是我所需要的,但对于不是......
我有一个名为rRna_RDP_taxonomy_phylum的文件,其中包含以下数据:364“Firmicutes”39.31 244“Proteobacteria”26.35 218“Actinobacteria”23.54 65“Bacteroidetes”......
我最近看到Matt Dowle用as.factor()编写了一些代码,专门用于(col in names_factors)set(dt,j = col,value = as.factor(dt [[col]]))对此答案的评论。我用过这个片段,但......
我希望在R中应用参数生存分析。我的数据是Veteran的肺癌研究数据。这是数据的前20列:我想我需要将celltype转换为分类虚拟...
我想在相同的高度大小间隔内选择高度大小间隔(高度> 0.50和高度<1.00)和模式中的两个级别(例如:norm和esti)。示例:sp ...
我想显示所有级别,长度(作为字符)不等于3个符号。以下代码返回每行的dt $ col的长度:with(dt,nchar(as.character(dt $ col)))但是如果我......
我有一个包含日期和时间变量的数据集。我创建了一个新变量(从时间变异)并称之为“time.of.day”。我想分配不同的标签(实际上是4个)时间条件...
我从Excel文件中获取数据(两个变量,一个分类,另一个数字),然后相应地将它们的类型更改为因子和数字:setwd(“D:/ Desktop /”)db_nouns = read.table(“...
我正在尝试重新定义当我使用cbind从其他数据帧的选择列创建数据帧时分配的级别。数据帧包含整数,rownames是字符串:...
我有一个数据集,其中包含我尝试格式化的大多数分类变量(因子)。数据集目前的格式如下:Obs X1 X2 X3 X4 ... X50 1 A B C D 2 B A D ...
我一整天都在尝试通过一个名为“得分”的数值来排列称为“类型”和“名称”的两个因子级别,并按分数排序按类别类型(颜色由类型确定)的图表。一世 ...
我不是R的专家...在我的训练数据中,有一个名为Source的领域有30个级别,我只想保持前2个级别,因为他们是大多数,并且需要改变所有其他级别。 ..