ggplot：两组均值的线图

Question

我在书堆里翻来覆去地寻找我的问题的答案；这个解决了我的问题，但我未能成功修改代码来修复我的图表。

我有数据，以长格式重新整形，如下所示：

ID          Var1      GenePosition   ContinuousOutcomeVar
1           control      X20068492 0.092813611
2           control      X20068492 0.001746708
3           case         X20068492 0.069251157
4           case         X20068492 0.003639304

每个

ID

每个位置都有一个

ContinuousOutcomeVar

值，共有 86 个位置和 10 个 ID。我想绘制一个折线图，其中 x 轴为位置，y 轴为连续结果变量。我想要两组：病例组和对照组，因此每个位置应该有两个点：一个是病例的平均值，一个是对照的平均值。然后我想要一条连接外壳的线和一条连接控件的线。我知道这很简单，但我是 R 新手 - 我已经研究了 8 个小时，但还不能完全正确。以下是我所拥有的；我真的很感激一些见解。如果这存在于堆栈中的某个地方，我真的很抱歉......我老实说，我仔细查看并尝试修改很多代码，但仍然没有得到正确的结果。

我的代码：此代码绘制每个位置处所有 ID 的所有值，并将它们连接到两个组。它在每个位置所有 10 个值的平均值处给了我一个黑点（我认为）：

lineplot <- ggplot(data=seq.long, aes(x=Position, y=PMethyl, 
    group=CACO, colour=CACO)) +
    stat_summary (fun.y=mean, geom="point", aes(group=1), color="black") +      
    geom_line() + geom_point()

我无法让 R 不绘制所有 10 个点；每个位置只有两个平均值（每个病例/对照组一个），病例和对照的值分别通过 x 轴上的一条线连接。

Answer 1

首先，调整原始样本数据以包含多个唯一的

GenePosition

。

dput(seq.long)
structure(list(ID = 1:8, Var1 = structure(c(2L, 2L, 1L, 1L, 2L, 
2L, 1L, 1L), .Label = c("case", "control"), class = "factor"), 
    GenePosition = structure(c(1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L
    ), .Label = c("X20068492", "X20068493"), class = "factor"), 
    ContinuousOutcomeVar = c(0.092813611, 0.001746708, 0.069251157, 
    0.003639304, 0.112813611, 0.002746708, 0.089251157, 0.004639304
    )), .Names = c("ID", "Var1", "GenePosition", "ContinuousOutcomeVar"
), class = "data.frame", row.names = c(NA, -8L))

如果您只想为每个

GenePosition

和

Var1

组合表示一个值，那么在绘图之前计算平均值会更容易。这可以通过库

ddply()

中的函数

plyr

来实现。

library(plyr)    
seq.long.sum<-ddply(seq.long,.(Var1,GenePosition),
       summarize, value = mean(ContinuousOutcomeVar))
seq.long.sum
     Var1 GenePosition      value
1    case    X20068492 0.03644523
2    case    X20068493 0.04694523
3 control    X20068492 0.04728016
4 control    X20068493 0.05778016

现在有了这个新的数据框，您只需给出

和

值。

Var1

应在

colour=

和

group=

中使用，以确保每组颜色不同且线条相连。

ggplot(seq.long.sum,aes(x=GenePosition,y=value,colour=Var1,group=Var1))+
   geom_point()+geom_line()

enter image description here

Answer 2

您只需使用以下代码即可：

ggplot(data,aes(x=GenePosition,y=ContinuousOutcomeVar,color=Var1))+
stat_summary(geom = 'point')+
stat_summary(geom = 'line')

ggplot：两组均值的线图

问题描述投票：0回答：2

2个回答

最新问题

ggplot：两组均值的线图

问题描述 投票：0回答：2

2个回答

最新问题

问题描述投票：0回答：2