Microsoft Excel 2003 中的相关性/数据挖掘

问题描述 投票:0回答:1

我有一个 Excel 电子表格,其中每一列都是一个特定变量。在我的专栏的末尾,我有一个特殊的最后一列,称为“类型”,可以是 A、B、C 或 D。

每一行都是一个具有不同变量的数据点,最终位于最后一列中记录的特定“类型”存储桶(A/B/C/D)中。

我需要一种方法来检查某种类型的所有条目(例如“C”或“C”|“D”),并找出哪个变量是最后一列的良好预测变量,以及哪些变量是比其他人更好的预测器。

有些变量是数字,其他变量是固定字符串(来自一组字符串),因此这不仅仅是数字/数字相关性。

Excel 2003 是一个很好的工具吗?或者是否有更好的统计程序可以使这变得更容易?我是否为每个类别创建数据透视图/直方图,或者是否有更好的方法来运行这些查询?

excel pivot data-mining correlation
1个回答
0
投票

您可以使用Microsoft Excel进行一些过滤,特别是清理数据(我的意思是,将数据值更改为一种类型,字符串或数字)。 Execl也做了一些数据挖掘。然而,对于您遇到的这类问题,我向您推荐的一个好工具是 WEKA。使用该工具,您可以对所有数据实例(行)进行关联分类预测(即类关联规则挖掘),从而确定哪些项目属于A/B/C/D。你的特殊属性将成为你的阶级属性。

© www.soinside.com 2019 - 2024. All rights reserved.