R将数据与因子和水平分组

问题描述 投票:3回答:2

我正在尝试制作一个频率表,将值分组为有限数量的箱。

说我有数据

X <- c(1,2,3,4,3,9, 20)

我可以创建一个频率表,使其显示所有空单元格,如下所示:

(factor(X, levels = c(0:max(X))))

我没有显示每个可能值的频率,而是想要将值>5分区,以便表格中的级别为:0, 1, 2, 3, 4, 5, and >5

我怎样才能做到这一点?

r grouping r-factor
2个回答
3
投票

您首先需要转换向量以使其具有唯一条目,然后您可以在factor()函数中添加缺少的级别:

X <- c(1,2,3,4,3,9,20)
X <- ifelse(X>5,">5",X)
X <- factor(X,levels=c(0:5,">5"))

这导致:

X [1] 1 2 3 4 3> 5> 5级别:0 1 2 3 4 5> 5


1
投票

Sacha已经给你一个有效的答案,但是为了将来参考,你可能想要熟悉cut函数,它旨在将连续变量分解为块。

x <- cut(x, c(-Inf, 0:5, Inf), labels=c(0:5, ">5"))
© www.soinside.com 2019 - 2024. All rights reserved.