想知道对我的特定地理空间数据运行什么统计测试?

问题描述 投票:0回答:1

我正在为学校做一个编码项目,你可以在其中选择你的主题和数据等。我选择的数据一开始看起来很简单(我喜欢它,因为绘图本身就是一个很好的挑战)-

我想看看臭氧水平与我所在城市家庭的种族群体之间是否存在相关性。基本上,我得到的人口普查数据告诉我给定人口普查区域中不同种族群体的家庭数量,因此种族群体是我的列,人口普查区域是我的行。

然后我还找到了每个人口普查区每月平均地面臭氧浓度的数据(因此在这种情况下,每个人口普查区只有一个数字)。

现在我被困住了。我知道如何编码和制作地图和图表,但我从未上过概率或统计课程。只计算到计算 3。 我的老师也是一名编码员,而不是统计学家,所以他也不确定要运行什么测试 - 他建议我谷歌,但谷歌没有帮助;这门课主要是学习绘制地理空间数据,然后制作图表,统计测试部分基本上是我完成之前需要的最后一件事。谷歌没有提供任何帮助,而且我现在已经进入该项目几个月了,无法选择新数据。

如何找到两个因素之间的相关性,同时考虑到不同组的总体数量不同?然后位置方面让我感到困惑?因为我的数据中有大约一千个人口普查区。我想这将是一个针对每个种族群体进行的测试?我真的不知道。或者某种测试或概率测试?

有什么想法吗?

我没有尝试太多,因为我是统计/数据分析/概率方面的初学者。我唯一的想法是我需要找到每个组的“相对曝光度”,但我一直很困惑这到底意味着什么?考虑将其发布到数学或统计堆栈交换中。

python statistics data-analysis probability
1个回答
0
投票

这里有一些可以帮助您开始的代码。他们应该解释何时进行统计测试。

这是一本带有人口普查数据的笔记本

我还有另一个更深入的分析,您可以关注更多编码示例。

© www.soinside.com 2019 - 2024. All rights reserved.