我正在使用分类数据,并希望过滤我的数据以制作更精确的图表。我正在处理家庭级数据,并且需要制作一个代码,用于过滤所有在数据中出现100次以上的家庭。我希望这是我的y轴信息(出现次数),然后x轴是物种的姓氏。我有物理图表,但过滤仍然无法正常工作。我正在使用ggpplot geom_bar。我需要创建一个代码来计算Family列中的所有单词,并且只包含出现超过100次的单词。这可能吗?
以下是钻石数据集中的示例:
library(tidyverse)
diamonds %>%
group_by(color) %>%
count() %>%
filter(n>99) %>%
print() %>%
ggplot()+geom_point(aes(x=color, y = n))