如何预测没有任何输出数据的连续变量?我只有输入数据

问题描述 投票:0回答:1

我正在从事一个网络安全项目,在该项目中,我们必须根据现有特征(主要是类别变量(还包括几个序数变量))对漏洞进行优先级排序。

这里的目标是检测最有可能被利用的漏洞,从而对其进行优先级排序。因此,我们必须预测得分为0-10。我们预测的最高等级(在本例中为10)将是最重要的漏洞,需要立即关注。

我们拥有的只是分类变量(作为输入要素)。

再次在这里总结问题:

当前输入功能:所有类别变量(带有两个序数变量)

当前输出功能:不存在

预期输出:预测分数在0-10之间,其中10是最严重的漏洞

从未遇到过这种问题。绝对看起来回归不是答案。能否请您分享您的想法。

python machine-learning predict continuous
1个回答
0
投票

我可能会误会,但您似乎没有足够的信息来进行预测。

我的理解是,您具有类别信息,但没有其他关联。对于某些类别,您可能可以根据专家的意见对您的预测进行硬编码。例如,仅通过了解所谓的ping来预测ping扫描基本上是无害的。要获得更多动态信息,您将需要比列出的信息更多的信息。


0
投票

如果您自己无法分配分数,则机器学习算法将无法做到这一点。它不知道要优化什么。

但是,您可以通过使用无监督算法根据分类值对数据进行聚类,然后查看聚类并确定哪些聚类似乎最重要的问题来获得成功。您可以找到有关类别k均值聚类here的讨论。

© www.soinside.com 2019 - 2024. All rights reserved.