Matlab PCA 屏幕图 - 哪个变量最重要?

问题描述 投票:0回答:1

不再是编码问题,而是“我明白我在做什么吗?”问题。

对一些最多包含 7 个变量的数据进行 PCA 分析,我想要一个屏幕图来显示每个变量对数据方差的影响程度。

我使用以下方法制作了一个碎石图:

    [coeff,score,latent,~,explained] = pca(X);

    bar(explained)

我对文档的理解是,输出全部排序“列按分量方差的降序排列”,所以,我如何知道哪个变量实际上占最大方差?就像我的数据有 7 个变量,那么我怎么知道它是变量 3 而不是变量 6?如果它没有排序,那就很明显了,但是按降序排序我怎么知道?

Matlab PCA 文档

matlab pca
1个回答
0
投票

计算 PCA 时,您会得到一个新的坐标系。这个新坐标系中的每个维度都解释了输入的一定量的方差,并根据该量化进行排序。

coeff(:,1)
是第一个 PCA 轴相对于输入轴的方向。该轴与数据中的最大方差对齐。
explained(1)
是该轴表示的数据中总方差的分数。

因此,

explained
的排序方式与
coeff
的列相同,并且与它们相关。它不涉及输入变量。

© www.soinside.com 2019 - 2024. All rights reserved.