如何(反向)从 pandas.corr() 查找(其他)值的范围?

问题描述 投票:0回答:1

虽然非常有趣,但我很难找到

pandas.DataFrame.corr()
的适用用途。

            age   weight   height       IQ
age        1.00     0.25     0.42     0.33
weight     0.25     1.00     0.82     0.69
height     0.42     0.82     1.00     0.08
IQ         0.33     0.69     0.08     1.00

给定年龄、体重和身高,如何在给定的

0.33
相关性内找到智商(范围)?

或者,给定年龄、体重、身高和智商,如何找到相关数——也就是说,如何找到每个单独数据的单独相关值(汇总到最终的 corr() 图)?

此外,一般来说,我想知道(实际的用例场景)专家如何以有意义的方式应用这些相关数据。

谢谢!

我尝试过搜索。

而且我不想建立模型来预测,我特别想了解

pandas.DataFrame.corr()

python pandas correlation
1个回答
0
投票

我们再举个例子:

该表告诉您,

'height'
'weight'
强相关,这意味着变量
'height'
中的高值通常与变量
'weight'
中的高值一起出现。低值经常与其他值一起出现。

相反,

'IQ'
'weight'
是弱关联的,这意味着变量
'IQ'
中的高值有时会与变量
'weight'
中的高值一起出现,但有时会与变量
'weight'
中的低值一起出现,反之亦然。

我想知道(实际的用例场景)专家如何以有意义的方式应用这些相关数据

相关表给出了有关变量的初步想法。在处理多元线性回归时,这可能发挥至关重要的作用。他们假设独立(预测)变量可能彼此不相关。为了解决这个问题,需要迭代地删除变量。在这种特定场景中,相关表(以及其他工具,如方差膨胀因子、VIF)迭代地帮助检查自变量是否仍然相关。

© www.soinside.com 2019 - 2024. All rights reserved.