naivebayes 相关问题

朴素贝叶斯是一种流行的(基线)文本分类方法。

带有NLTK的半监督朴素贝叶斯[已关闭]

我基于EM(期望最大化算法)在Python中构建了一个半监督版的NLTK Naive Bayes。然而,在EM的一些迭代中,我得到负的对数似然(...

回答 1 投票 6

Apache Mahout中的加权朴素贝叶斯分类器

我正在使用朴素贝叶斯分类器进行客户支持的情绪分析。但遗憾的是,我在客户支持域中没有大量带注释的数据集。但我有一点......

回答 1 投票 2

将文档分类为类别

我有一个存储在Postgres数据库中的大约300k文档,这些文档用主题类别标记(总共有大约150个类别)。我还有另外150k文件还没有......

回答 3 投票 33

在NLTK中实现Bag-of-Words朴素贝叶斯分类器

我基本上和这个家伙有同样的问题.NNive Bayes分类器的NLTK书中的例子只考虑一个单词是否作为一个特征在文档中出现..它不考虑......

回答 3 投票 23

朴素的贝叶斯垃圾邮件过滤效果

天真贝叶斯过滤对过滤垃圾邮件的效果如何?我听说垃圾邮件发送者可以通过填充额外的非垃圾邮件相关词语来轻松绕过它们。贝叶斯可以使用哪些编程技巧......

回答 4 投票 7

面向对象的贝叶斯垃圾邮件过滤?

我想知道是否有针对垃圾邮件和文本分类的贝叶斯过滤的任何良好和干净的面向对象编程(OOP)实现?这仅用于学习目的。

回答 6 投票 26

我想预测新事件的更新数量?如何在python中做到这一点?

我有一个n个事件的数据集,其中包含一些信息。描述(文本为英语或德语)和no.of更新信息(intiger)等信息。我想预测......

回答 2 投票 0

如何用用户,文本数据调用MultinomialNB.predict()?

我正在创建一个简单的推荐器,根据推文的相似性推荐其他用户。我使用tfidf来矢量化所有文本,我能够将数据拟合到MultinomialNB ...

回答 1 投票 0

在Dataframe中查找BernoulliNB概率

我有一些训练数据(TRAIN)和一些测试数据(TEST)。每个数据帧的每一行包含一个观察到的类(X)和一些二进制(Y)列。 BernoulliNB预测给出Y的X的概率......

回答 1 投票 0

朴素贝叶斯如何运作

我已经读过天真的贝叶斯,它是一种分类技术算法,可以根据你给出的数据进行预测,但在这个例子中,我只是无法得到它的输出[3,4] ......

回答 1 投票 1

如何测试我的NLP朴素贝叶斯分类器的新单词集

我使用python scikit构建一个基于Naive base的NLP分类器 - 重点是,我希望我的分类器能够分类一个新文本“不属于我的任何训练或测试数据...

回答 1 投票 -1

什么是Python中的分类器(高斯朴素贝叶斯)?

好的,所以当我使用下面的代码时,那个“clf”部分究竟是什么意思?那是一个变量吗?我知道这是一个分类器但是分类器是python中的一个函数,或者它只是一个名为...的变量。

回答 1 投票 -1

如果用变量来设计因变量,我可以使用变量作为解释变量吗?

我正在尝试创建3种分类模型:朴素贝叶斯,随机森林和SVM。我试图预测的变量是电影判决,其类别为“点击”或“翻牌”。我设计了......的价值观

回答 2 投票 0

Udacity:无法在Ud120项目中下载数据集“enron_mail_20150507.tar.gz”

我无法通过“python startup.py”下载“enron_mail_20150507.tar.gz”。我有以下错误,不知道如何解决。下载安然数据集(这可能需要一段时间)......

回答 1 投票 0

垃圾邮件过滤器 - Python新手

所以我的任务是在Python中为电子邮件数据集创建分类算法:https://archive.ics.uci.edu/ml/datasets/spambase我需要能够处理数据集,应用我的...

回答 1 投票 1

为什么天真的贝叶斯需要平衡的训练数据?

我使用Naive Bayes算法创建了一个单词情感应用程序。该分类训练数据中有两种类型的标准,即积极训练数据和负训练数据。我拿 ...

回答 1 投票 -1

朴素贝叶斯多项式模型

对于电影评论数据集,我正在创建一个朴素的贝叶斯多项式模型。现在在训练数据集中,每种类型都有评论。因此,不要为电影评论创建通用模型......

回答 2 投票 1

如何使用sklearn增加MultinomialNB()的准确度分数,并使用matplotlib在图形中显示结果?

我正在研究一个如下所示的数据集:在我附带的屏幕截图中,您可以看到我的数据集包含16行和12个元组,但实际上它包含521行和12个元组。第一栏是......

回答 1 投票 0

对于同一数据集,one_hot_encode和count_vectorizer之间的准确度如何不同?

onehot_enc,BernoulliNB:在这里,我使用了两个不同的文件进行评论和标签,我使用“train_test_split”将数据随机分成80%的列车数据和20%的测试数据。 reviews.txt:...

回答 1 投票 0

在Naive bayes中获得特征重要性

我的问题与此类似,如何在天真的贝叶斯中获得功能重要性?但是当我运行代码neg_class_prob_sorted = NB_optimal.feature_log_prob_ [0,:]。argsort()...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.