如何根据数值自变量看到其因变量的理想范围?

问题描述 投票:0回答:1

我目前正在使用 WEKA 和基于住房的数据集。我有一个数值变量“平方英尺”和一个二进制是/否变量“需求”。 我试图找出哪个数量或平方英尺范围最有可能属于需求类别(所以什么尺寸的房产需求最高)。

我尝试在 WEKA 中以散点图形式将其可视化,y 轴为平方英尺,x 轴为需求量,但它没有显示足够具体的数字,仅沿轴以 3 个间隔显示,这似乎有点无用。

是否有可以在这里使用的回归模型或者更清晰的方式来可视化绘图?它必须在 WEKA 中完成,否则我只会使用 matplotlib。

database dataset weka
1个回答
0
投票

[这并不是一个真正的编程问题...]

回归模型仅在类为数字时才有效,但是,您的类是名义类 (

yes/no
)。

您可以尝试使用 weka.filters.supervised.attribute.Discretize 过滤器离散化输入变量。这个监督版本在生成 bin 时考虑了类属性。

© www.soinside.com 2019 - 2024. All rights reserved.