text-classification 相关问题

简单地说,文本分类就是将一段文本放入一组(主要是预定义的)类别中。这是许多现实世界应用中出现的最重要问题之一。例如,文本分类的一个示例是自动呼叫中心,其希望将投诉自动分类到最合适的问题桶中。

NLP数据准备和文本分类任务的排序

我在网上阅读了很多关于stackoverflow的教程,但有一个问题对我来说仍然模糊不清。如果只考虑收集多标签培训数据的阶段,采用何种方式(见下文)......

回答 1 投票 1

如何识别作为光学字符识别(OCR)输出的文本中的实体?

我是NLP的新手,并试图用文本数据进行多类分类。我有关于多类分类的bean阅读,但我面临的问题是我有非结构化的文本数据。生病 ...

回答 1 投票 2

不平衡数据集的一类文本分类

我从网页文本数据中抓取了不平衡的数据集并手动将其分类为正类,而另一个负面类可以包含我标记的任何类型的文本数据...

回答 1 投票 2

对非功能性要求进行分类

我正在开发一个机器学习项目,它分析需求规范并将非功能需求分类到数据库,Web套接字,后端技术等类别......

回答 1 投票 0

句子分类到预定义的主题

可以使用哪些无监督的机器学习算法根据其中的某些单词将句子分类为固定数量的主题?就像选举和总统的话语属于政治......

回答 1 投票 0

由于尺寸不同,无法在scikit-learn中使用FeatureUnion

我正在尝试使用FeatureUnion从数据结构中提取不同的功能,但由于尺寸不同而失败:ValueError:blocks [0,:]具有不兼容的行维度Implementaion My ...

回答 2 投票 12

使用word2vec字嵌入作为文本分类的特征向量(类似于计数向量化器/ tfidf特征向量)

我正在尝试使用机器学习进行一些文本分类,并且我已经使用简单的单词包方法从每个处理的文本数据中提取了特征向量(计数...

回答 1 投票 -1

超出关键字依赖性的文本分类并推断出实际含义

我正在尝试开发一个文本分类器,将一段文本分类为私有或公共。以医疗或健康信息为例。我能想到的典型分类器......

回答 3 投票 9

Tensorflow错误使用我自己的数据进行文本分类

我一直在玩Tensorflow库做教程。我正在使用这个例子。我将示例中的参数更改为:n_classes = 15到:n_classes = 2,因为我只有......

回答 1 投票 1

随机梯度下降是分类器还是优化器?

我是机器学习的新手,我正在尝试分析我的项目的分类算法。我在sklearn库中遇到了SGDClassifier。但是很多论文都把SGD称为......

回答 3 投票 1

在文本情感分析中删除textblob中的停用词的有效方法是什么?

我正在尝试实施朴素贝叶斯算法,用于新闻报纸头条新闻的情绪分析。我正在使用TextBlob来实现这个目的,我发现很难删除诸如'a','the','等词。

回答 2 投票 1

将纯文本文件加载到PyTorch中

我有两个单独的文件,一个是文本文件,每行是一个文本。另一个文件包含该对应行的类标签。如何将其加载到PyTorch并执行...

回答 1 投票 0

fasttext保持预测一个标签

我试图使用fasttext来标记一些数据[url]或[PN],只是为了在每个标签的6k训练后对其进行测试并预测它一直预测[PN]训练命令fasttext supervised -input ...

回答 1 投票 0

NLP - 用于对段落标签进行分类的技术?

我对NLP很新,并试图学习可以帮助我完成工作的技巧。这是我的任务:我必须根据文本备忘录对钻井过程的各个阶段进行分类。我必须归类......

回答 1 投票 0

预测给定文档的每个分类箱的概率分数

我正在创建一个python模型,它将根据文本对给定文档进行分类。因为每个文档仍然需要由人工手动审查,我正在创建一个建议平台,将...

回答 1 投票 1

CountVectorizer值在分类器中单独工作,在添加其他功能时无法正常工作

我有一个推特个人资料的CSV数据,包含:姓名,描述,粉丝数,跟随计数,机器人(我想预测的类)我在使用时成功执行了分类模型...

回答 1 投票 1

Weka:如何转换与列车数据属性一致的测试数据属性?

我正在做文本分类任务。我用火车文本数据构建了一个分类器,有1700多个属性(单词)。但是,当我在上面运行测试数据时,我的测试数据只有500多个属性(单词)...

回答 1 投票 -1

Fasttext中的精确度和召回率

我是Fasttext的新手。我已经有一些关于这个库的问题,对某些人来说它们看起来很明显,但我真的想要得到正确的直觉。非常感谢您的帮助。首先......

回答 2 投票 1

使用nltk对文本文档进行分类

我正在开展一个项目,我正在收集电子邮件,使用电子邮件包剥离邮件正文,然后我想使用体育,政治,技术等标签对它们进行分类....

回答 2 投票 2

Doc2Vec和分类 - 结果很差

我有6000个观测数据集;它的样本如下:job_id job_title job_sector 30018141中学助教......

回答 3 投票 2

© www.soinside.com 2019 - 2024. All rights reserved.