使用Tidyverse在R中将连续变量重新编码为具有*特定类别的类别

问题描述 投票:0回答:1

第一次问一个问题,但我会尽量按书中的内容播放:)

问题很简单,但是我在SO的任何地方都找不到我想要的东西。我找到了this helpful answer to almost the same question,但是并不能完全满足我的需要。

我有受访者的年龄,是一个连续变量,我想使用tidyverse将其重新编码为分类。上面的链接包含对函数cut_number()cut_interval()cut_width()的说明,但是这些对我不起作用的原因是因为我想重新编码为我已经确定的类别时间范围,即范围18-34、35-54和55+。这些cut函数都不允许我执行此操作(或者至少我不知道如何操作)。

我能够使用:

data$age[data$"Age(Self-report)"<35] <- "18-34" data$age[data$"Age(Self-report)">34 & data$"Age(Self-report)"<55] <- "35-54" data$age[data$"Age(Self-report)">55] <- "55+"

但是我正在尝试保持编码风格的一致性,并想学习如何在Tidyverse中做到这一点。感谢您提供的所有帮助!

[第一次问一个问题,但我会尝试按书讲:)这个问题很简单,但是我在SO的任何地方都找不到我想要的东西。我发现这个有用的答案...

r ggplot2 tidyverse data-cleaning categorical-data
1个回答
0
投票

tidyverse方法将利用dplyr::case_when来重新编码变量,如下所示:

© www.soinside.com 2019 - 2024. All rights reserved.