我计划使用朴素贝叶斯分类模型实现垃圾邮件过滤器。
在线我看到很多关于朴素贝叶斯分类的信息,但问题在于它有很多数学内容,而不是明确说明它是如何完成的。问题是我更像是一个程序员而不是数学家(是的,我在学校里学过了概率论和贝叶斯定理,但是很长一段时间都没有接触过,而且我现在没有学到它的乐趣(几乎有提前3周工作原型))。
因此,如果有人可以解释或指出我为程序员解释的位置而不是数学家,那将是一个很大的帮助。
PS:顺便说一下,如果你想知道,我必须在C中实现它。 :(
此致,Microkernel
本书Programming Collective Intelligence有章节介绍了这个和其他方法。可以在不参考前面章节的情况下理解章节(#6),书写清楚,并且仅讨论完成工作所需的最小数学。
你可以试试这个website。它有一些源代码。
我强烈推荐Andrew Moore's tutorials,我认为你应该从this one开始。
您还可以查看POPFile,一个开源垃圾邮件过滤器引擎。