朴素贝叶斯分类器中的“幼稚”是什么?

问题描述 投票:31回答:4

Naive Bayes的天真是什么?

algorithm classification naivebayes
4个回答
48
投票

实际上有一个很好的例子on Wikipedia

简单来说,朴素贝叶斯分类器假定在给定类变量的情况下,类的特定特征的存在(或不存在)与任何其他特征的存在(或不存在)无关。例如,如果果实是红色的,圆形的,直径约4英寸,果实可以被认为是苹果。即使这些特征相互依赖或者存在其他特征,一个朴素的贝叶斯分类器也会考虑所有的这些属性独立地促成了这种水果是苹果的概率。

基本上,它是“天真的”,因为它做出的假设可能会或可能不会是正确的。


10
投票

如果您的数据由特征向量X = {x1,x2,... x10}和您的类标签Y = {y1,y2,.. y5}组成。因此,贝叶斯分类器将正确的类标签标识为最大化以下公式的类标签:

P(y / X)= P(X / y)* P(y)= P(x1,x2,... x10 / y)* P(y)

因此,它仍然不是天真的。然而,很难计算P(x1,x2,... x10 / Y),因此我们假设这些特征是独立的,这就是我们所说的朴素假设,因此,我们最终得到以下公式

P(y / X)= P(x1 / y)* P(x2 / y)* ... P(x10 / y)* P(y)


4
投票

它被称为天真,因为它假设所有属性彼此独立。这个假设是为什么它被称为天真,因为在许多现实世界的情况下,这是不适合的。尽管如此,分类器在许多现实世界的情况下工作得非常好,并且在某些情况下(尽管不是全部)具有与中性网络和SVM相当的性能。


1
投票

对于分类,当我们找到联合分布时,问题在于它只是反映训练数据并且也很难计算。所以我们需要一些更有用的概括。

朴素模型强烈地概括了每个属性独立于任何其他属性分布。

它确实有助于在很大程度上不关心属性之间的依赖关系。

© www.soinside.com 2019 - 2024. All rights reserved.