我学习geom_bar上r4ds.had.co.nz.的3.7节我运行一个像这样的代码:
library(ggplot2)
ggplot(data = diamonds) + geom_bar(mapping = aes(x = cut, y = ..prop.., group = 1))
然后,我有这样的情节:
点是,如果我排除“组= 1”的部分:
library(ggplot2)
ggplot(data = diamonds) + geom_bar(mapping = aes(x = cut, y = ..prop..))
该地块将是错误的,
但是,如果我按组= 2或组=“X”代替组= 1,剧情看起来还是正确的。所以,我不太明白组= 1在这里和如何使用它的意义。
group="whatever"
是一个“虚拟”的分组,以覆盖默认行为,这(在这里)是按cut
并且通常是组由x变量。对于geom_bar
默认是由x变量组以便单独地计数在x变量的每个水平行的数目。例如,在这里,默认将是geom_bar
与cut
等于“公平”,“好”,等返回的行数
然而,如果我们要的地步,那么我们就需要考虑cut
各级在一起。在第二个图中,数据首先由cut
分组,所以cut
的每一级被分开考虑。公平的公平的比例为100%,如在好好,等等group=1
(或group="x"
等)的比例可防止此,使切口的每个级别的比例将是相对于切口的所有级别。
集团将帮助情节看包含特定的切割和比例发现相对于整个数据库在整个数据集的理想切割比例的特定行。
如果不使用组时,比例计算相对于包含字段并且最终将是100%在任何情况下的数据。例如,在理想切割特定数据的理想切割的比例将是1。