无法确定我的数据是否呈正态分布或未在 R 中使用 QQ-plot

问题描述 投票:0回答:1

我无法从所附数据中解释我的 QQ 图。 Shapiro-Wilk 检验 p 值 = 0.14,我知道这意味着分布不会明显偏离正态分布。谁能确认根据该数据生成的QQ图是否支持这个结论,或者我应该更加谨慎?附上代码供任何人复制和粘贴。

注意:我在 R/RStudio 中制作了这个

PHD<- c(3.3,
    3.3,
    3.2,
    3.3,
    3.5,
    3.1,
    3.3,
    2.8,
    3.5,
    2.5,
    3.5,
    3.2,
    2.9,
    3.2,
    2.3,
    3.3,
    3.6,
    3.1,
    2.8,
    3.8,
    3.1,
    3.1,
    3.0,
    3.4,
    3.0,
    3.0,
    3.2,
    3.6,
    3.1,
    3.9,
    3.6,
    3.4,
    3.7,
    3.7,
    3.3,
    3.7,
    3.3,
    3.1,
    3.4,
    2.8,
    3.6,
    3.4,
    3.6,
    3.2,
    3.7,
    3.4,
    3.3,
    4.1,
    3.5,
    3.6,
    3.3,
    3.4,
    3.3,
    3.3,
    3.7,
    3.1,
    3.4,
    3.8,
    3.1,
    3.9,
    3.3,
    3.6,
    3.2,
    4.0,
    3.6,
    3.3,
    3.3,
    3.5,
    3.3,
    3.8,
    4.1,
    3.7,
    3.7,
    4.0,
    3.8,
    4.0,
    3.4,
    4.1,
    4.0,
    3.6,
    3.9,
    3.5,
    3.2,
    2.7,
    3.2,
    3.3,
    3.7,
    2.9)

library(ggplot2)

data = data.frame(PHD)

ggplot(data = data, aes(sample = PHD))+
  geom_qq()+
  geom_qq_line(size = 1, color = "red")
statistics visualization normal-distribution qqplot
1个回答
0
投票

当然,没有一个经验分布是完全正态的,但你的分布看起来很接近,因为你的数据点接近 qq 线。左侧的点略低一些,右侧的点略高一些,因此您的分布有点“重尾”……在极端情况下,点比预期的要多。由于您的数据四舍五入为 0.1,探索该问题的一种方法是生成正态分布的随机样本,对它们进行四舍五入,然后查看结果。对我来说,它看起来与你的经验数据相似。

test_data <- round(rnorm(500, mean=mean(PHD), sd = sd(PHD)),1)
df = data.frame(test_data)
ggplot(data = df, aes(sample=test_data))+
  geom_qq()+
  geom_qq_line(size = 1, color = "red")

另一方面,正式测试表明接近,但并不完全

shapiro.test(data$PHD)
© www.soinside.com 2019 - 2024. All rights reserved.