哪个类是积极的，以及如何在为ML准备数据时确定真正的警报

问题描述投票：0回答：1

我正在为机器学习准备一些数据。这个问题很容易，但我有点困惑。

假设有一个系统每1小时有大约100个警报，只有1或2个警报是它们的真正警报。人类会忽略假警报。我已经收集了一些看起来像功能的数据，并给出假的或真正的警报标签0或1。

在这种情况下，真正的警报是0还是1？这样，TP，TN，FP，FN，机会等级就会改变。我们感兴趣的是真正的警报，即使手动检查所有警报，我们也不想错过它。

几乎警报是假的，所以机会水平将超过95％。然后主要班级和积极班级将是1和假警报？但我们的兴趣不是假警报。在这种情况下我应该如何设置标签？

machine-learning

classification

text-classification

confusion-matrix

1个回答

1
投票

两种方式对模型的性能同样可以，因为损失函数不受标记1或0的方式的影响。就个人而言，我认为0应该用于伪造的，1用于实际的。