简单地说,文本分类就是将一段文本放入一组(主要是预定义的)类别中。这是许多现实世界应用中出现的最重要问题之一。例如,文本分类的一个示例是自动呼叫中心,其希望将投诉自动分类到最合适的问题桶中。
比方说,我目前在做文本分类有两个不同的班级。标记的数据我现在已经是一个我已经手动分为X或Y的数据集是ATM样的大...
我工作的一个代码,分类科学文章(使用标题和摘要)的文本。而对于这个我使用的是SVM,它提供了一个良好的精度(83%)。同时,我用了CNN ...
什么是“黄金人气分布”的意味?我读了几篇论文,他们已经提及的“黄金感悟分布:我试图找到它在谷歌,但我找不到解释或...
提取最重要的功能(每类)使用mutual_info_classif
我使用mutual_info_classif确定二进制文本分类任务是最重要的话:mi_score = mutual_info_classif(X,Y),但上面给出的特征分数的数组...
我想要做的就是我希望我的web应用程序把多个文件作为输入,并使用我的模型进行归类和归类文档存储到不同的文件夹。我已经开发出一种模型,...
我有一个文章标题和我想基于匹配的词进行分类文摘数据集。 “这是我想基于这从一个匹配的字词进行分类文本的例子...
根据输入形状的计算是否存在差异? (使用Tensorflow的Python中的CNN)
我参考了论文解决了文本分类问题(Kim,2014)。然后我发现在两个模型之间,左边的模型(模型1)花费的时间比...的大约多2.5倍。
我有用户评论数据集,如review-1,0,1,1,0,0 review-1是用户评论,0,1,1,0,0是评论类别。一篇评论可以有多个类别。我想预测评论的类别。所以我 ...
我有一个包含产品的数据框,在这个数据框中我有一些功能,如:品牌,cat1,cat2,cat3,city,desc,image_count,里程,价格,标题,年份。目标是预测类别......
我正在训练一个基于LSTM的循环神经网络进行文本分类,我有一个奇怪的行为。使用相同的代码和相同的训练集,我获得了非常不同的准确度。一世 ...
关于文本分类的当前最新数据增强技术是什么?我在网上做了一些关于如何通过做一些数据转换扩展我的训练集的研究,......
作为练习,我只需要使用密集层来执行文本分类。我想利用单词嵌入,问题在于数据集然后是3D(样本,句子的单词,嵌入...
我已经使用sklearn为两个类训练了SVM和NN模型。一个班级有24000条推文和另外32000条推文。当我进行验证时,它会像这样给出 - text_clf = Pipeline([('vect',...
更新我在使用朴素贝叶斯设置文本分类时遇到问题。首先,我有3个文本文件,两个带有好/坏字的模板,一个测试文件。我的TermDocumentMatrix已创建,我......
我正在使用带有文本Yelp餐厅评论的数据集以及他们的“明星”评级。我的数据是一个df,看起来像这样:Textual Review数字评级“超酷餐厅”5“可怕......
预处理我们的Twitter文本以在二进制类之间进行分类的重要步骤是什么。我做的是我删除了标签并保留它没有主题标签,我还使用了一些正则表达式来...
如果其中一个主题过于宽泛而另一个非常狭窄,如何平衡主题,两个类数据集?
我有简单的预测,其中数据集由每个类e.i的2300个样本组成。总计= 4600(二进制分类)。第一类包含除了其他类以外的所有新闻类型,......
我有一个数据帧,df由文本和数字功能组成,类似于下面所示。功能1功能2功能3功能4标签10 20 ...
我在网上阅读了很多关于stackoverflow的教程,但有一个问题对我来说仍然模糊不清。如果只考虑收集多标签培训数据的阶段,采用何种方式(见下文)......
我是NLP的新手,并试图用文本数据进行多类分类。我有关于多类分类的bean阅读,但我面临的问题是我有非结构化的文本数据。生病 ...