1 2
y1 48 44
y2 38 39
y3 49 56
y4 3 4
y5 55 28
y6 99 101
y7 121 120
y8 2 6
1)鉴于这种描述性统计,其中1和2是结果(Y = 1或2),Y1 - Y8是变量,我想使用不等方差进行独立的t检验。 Y4和Y8是二进制变量,我需要执行卡方。我希望这些测试的结果作为我的第三列,看看哪个变量是组区别的驱动因素(Y = 1或2)。我怎么能在R中做到这一点?
2)如果结果变为三个类别(Y = 1,2和3),我如何对连续变量进行ANOVA,对R中的Y4和Y8进行卡方检验?
首先,您不应将二进制变量与其余测量值混合使用。我将首先将输入数据帧分成两个数据帧。
df2 <- df1[c(4, 8), ]
df3 <- df1[-c(4, 8), ]
现在测试。 t.test
将需要长格式的数据,有关重塑数据集的其他方法,请参阅this question。
chisq.test(df2)
long <- reshape2::melt(df3)
t.test(value ~ variable, long)
dput
格式的数据。
df1 <-
structure(list(`1` = c(48L, 38L, 49L, 3L, 55L,
99L, 121L, 2L), `2` = c(44L, 39L, 56L, 4L, 28L,
101L, 120L, 6L)), class = "data.frame",
row.names = c("y1", "y2", "y3", "y4", "y5",
"y6", "y7", "y8"))