第一次问一个问题,但我会尽量按书中的内容播放:)
问题很简单,但是我在SO的任何地方都找不到我想要的东西。我找到了this helpful answer to almost the same question,但是并不能完全满足我的需要。
我有受访者的年龄,是一个连续变量,我想使用tidyverse将其重新编码为分类。上面的链接包含对函数cut_number()
,cut_interval()
和cut_width()
的说明,但是这些对我不起作用的原因是因为我想重新编码为我已经确定的类别时间范围,即范围18-34、35-54和55+。这些cut
函数都不允许我执行此操作(或者至少我不知道如何操作)。
我能够使用:
data$age[data$"Age(Self-report)"<35] <- "18-34"
data$age[data$"Age(Self-report)">34 & data$"Age(Self-report)"<55] <- "35-54"
data$age[data$"Age(Self-report)">55] <- "55+"
但是我正在尝试保持编码风格的一致性,并想学习如何在Tidyverse中做到这一点。感谢您提供的所有帮助!
[第一次问一个问题,但我会尝试按书讲:)这个问题很简单,但是我在SO的任何地方都找不到我想要的东西。我发现这个有用的答案...
tidyverse
方法将利用dplyr::case_when
来重新编码变量,如下所示: