text-classification 相关问题

简单地说,文本分类就是将一段文本放入一组(主要是预定义的)类别中。这是许多现实世界应用中出现的最重要问题之一。例如,文本分类的一个示例是自动呼叫中心,其希望将投诉自动分类到最合适的问题桶中。

[使用Python进行文本分类存储

在文本分类中,我拥有近百万种功能,现在我想对常用功能进行分类。请提出一些建议。例如:<1> [alumel','alumin','alumina','aluminia','...

回答 1 投票 0

如何根据内容对与圣经有关的文本进行分类

我有一个来自社交网络(FB,Twitter)评论的文本数据库。我的目标是根据内容对与圣经有密切关系的文本进行分类(例如,如果有引文或“ ...

回答 1 投票 0


如何使OneClassSVM模型更准确? (Scikit学习)

我一直在尝试使用该作者撰写的多篇文章对作者进行分类,然后将其用于查找其他文章中的相似之处,以在测试组中识别该作者。我有...

回答 2 投票 0

用于文本分类的一类SVM模型(scikit-learn)

我正在尝试对一组文本进行分类,以用于预测测试文本集中的相似文本。我正在使用one_class_svm模型。 'author_corpus'包含书面文本列表...

回答 1 投票 0

使用NLTK生成将推文归类为预定义类别的词典

我有一个Twitter用户列表(screen_names),我需要将其归类为7个预定义类别-教育,艺术,体育,商业,政治,汽车,技术,根据其兴趣...

回答 1 投票 0

为什么要通过HuggingFace进行序列分类(DistilBertForSequenceClassification)的第一个隐藏状态

在HuggingFace进行的序列分类的最后几层中,他们采用了用于分类的变压器输出的序列长度的第一个隐藏状态。 hidden_ state = ...

回答 1 投票 0

使用朴素贝叶斯进行多分类

我的数据集如下:data = [[92,155],[56、186、117、210、224],[247、202、189、210、65、3、270、224],[20 ,14,14,157,224],[17,89,158,224],[263,283,68,224],[182,166,224],[...] >>

回答 1 投票 0

列表中单词的二进制分类器

我已经使用OCR从许多样式化文档中提取了文本。现在,我想对数据进行形式化并提取城市名称。由于OCR不能正常工作,因此有时名称拼写错误,并且...

回答 1 投票 0

将相应的类添加到predict_proba(GridSearchCV sklearn)

我正在使用GridSearchCV和管道来对一些文本文档进行分类。代码段:clf = Pipeline([[''vect',TfidfVectorizer()),('clf',SVC())])参数= {'vect__ngram_range':[(1,2)],'...] >

回答 2 投票 4

如何细化中性情绪是正面还是负面

我正在通过视觉和文字提示进行多模式情感分析。我的输入数据集包含地面真相的中立情绪,但我需要进行二进制分类才能对...

回答 1 投票 1

我如何使我的算法与KNN文本分类一起使用?

[尝试使我的分类接受文本(字符串),而不仅仅是数字(数字)。处理数据,承载大量拉出的文章,我希望分类算法显示要... ...>

回答 1 投票 0

带有word2vec堆栈溢出标记预测变量的文本分类

我正在使用堆栈溢出标记预测变量。我有一个数据框df,其中包含功能“ post”和标签“ Tags”,它们可以是多标签的。我的df是:标记发布0 [php]检查上传文件...

回答 1 投票 -1

句子的Pytorch数据加载器

[我已经收集了一个小的数据集用于二进制文本分类,我的目标是使用卷积神经网络提出的用于句子分类的方法训练模型,我开始...

回答 1 投票 1

InvalidArgumentError:找到2个根本错误。 Tensorflow文本分类模型中不兼容的形状

我正在尝试从以下基于本文的仓库中获取代码。它有很多错误,但我大部分都能正常工作。但是,我一直遇到同样的问题,而且确实做到了...

回答 1 投票 1

显示k个最近的邻居进行文本分类

我有一个CSV文件(corpus.csv),其中带有以下格式的语料库分级摘要(文本):Institute,Score,Abstract -------------------- -------------------------------------------------- ...

回答 1 投票 0


如何在python-3中分析PDF中的特定文本字符串?

我正在研究一些用于识别PDF文档中命名实体(NER)的代码。我当前的代码分三步工作。首先,它将PDF转换为文本字符串。其次,它标记文本。第三,...

回答 1 投票 0

如何从扫描的文档中提取垂直标签和值?

我正在制作一个文档解析器,它从文档中提取数据字段并以结构化方式存储它们。我的数据集中的每个字段都是水平的,很容易提取。但是模型失败了...

回答 1 投票 1

Snorkel:我可以在数据集中使用不同的功能来生成标记函数VS训练分类器吗?

[我具有一组功能来构建标签功能(A组),另一组功能来训练sklearn分类器(B组)。生成模型将输出一组概率标签,这些i ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.