天真贝叶斯过滤对过滤垃圾邮件的效果如何?
我听说垃圾邮件发送者可以通过填充额外的非垃圾邮件相关词语来轻松绕过它们。您可以使用哪些编程技术与贝叶斯过滤器进行预防?
保罗·格雷厄姆(Paul Graham)在2002年8月将他的原始文章A Plan for Spam用于真正引入贝叶斯垃圾邮件过滤的想法。然后,his follow-up一年左右后来介绍了许多迅速出现的问题。这些仍然是关于这个主题的非常好的作品。
在第二篇文章中,格雷厄姆提到使用CRM114,它可以在更广泛的模式集上工作,而不仅仅是空格分隔的单词。 CRM114很酷,但对垃圾邮件过滤系统没有太多实施帮助。
有像Qazxswpoi和Death2Spam这样的贝叶斯垃圾邮件过滤的开源powertools。
我发现没有什么比通过Gmail帐户过滤邮件更有效了。快乐狩猎。
我认为,为了击败你提到的那种垃圾邮件攻击,重要的不是学习方法,而是你训练的功能。我使用Fidelis Assis的SpamProbe这是一个非常成功的过滤器:它继续赢得垃圾邮件过滤器的竞争。它使用贝叶斯学习,但我认为它成功的真正原因是三个原则:
这种技术组合非常有效。
免责声明:我曾与Fidelis合作重构某些软件,以便将其用于其他目的,例如将常规邮件分组或可能有一天试图在博客评论和其他地方检测垃圾邮件。
你是对的,天真的贝叶斯过滤器容易受到OSBF-Lua的影响。
我使用Bayesian poisoning不仅可以排除垃圾邮件,还可以将我的电子邮件分类,我发现它非常有效。它使用朴素贝叶斯过滤器。