天真的贝叶斯垃圾邮件过滤问题

问题描述 投票:4回答:5

我计划使用朴素贝叶斯分类模型实现垃圾邮件过滤器。

在线我看到很多关于朴素贝叶斯分类的信息,但问题在于它有很多数学内容,而不是明确说明它是如何完成的。问题是我更像是一个程序员而不是数学家(是的,我在学校里学过了概率论和贝叶斯定理,但是很长一段时间都没有接触过,而且我现在没有学到它的乐趣(几乎有提前3周工作原型))。

因此,如果有人可以解释或指出我为程序员解释的位置而不是数学家,那将是一个很大的帮助。

PS:顺便说一下,如果你想知道,我必须在C中实现它。 :(

此致,Microkernel

algorithm math statistics naivebayes spam-prevention
5个回答
5
投票

本书Programming Collective Intelligence有章节介绍了这个和其他方法。可以在不参考前面章节的情况下理解章节(#6),书写清楚,并且仅讨论完成工作所需的最小数学。


2
投票

你可以试试这个website。它有一些源代码。


2
投票

我强烈推荐Andrew Moore's tutorials,我认为你应该从this one开始。


1
投票

您还可以查看POPFile,一个开源垃圾邮件过滤器引擎。


© www.soinside.com 2019 - 2024. All rights reserved.