text-classification 相关问题

简单地说,文本分类就是将一段文本放入一组(主要是预定义的)类别中。这是许多现实世界应用中出现的最重要问题之一。例如,文本分类的一个示例是自动呼叫中心,其希望将投诉自动分类到最合适的问题桶中。

如何使用Keras创建一个BERT层?

我正在尝试使用一个BERT层来将文本评论分为正面或负面。# 类似于教程。# https:/towardsdatascience.combert-in-keras-with-tensorflow-hub-76bcbc9417b # 确保... ...

回答 1 投票 0

RoBERTa 分类 RuntimeError: shape '[-1, 9]' 对于大小为 8 的输入无效。

m = MultiLabelBinarizer() X = pd.read_csv('datadata.csv', sep=None, engine='python') X = X.dropna() Y_train = m.fit_transform(X['label']) Y_train2 = [list(i) for i in Y_train] ...

回答 1 投票 0

天真贝叶斯函数的下标出界错误。

我正在创建一个用户定义的奈夫贝叶斯函数,在这里我显示了准确率、错误分类和召回率。我还没有对召回率进行编码。帮助将非常感激以下是我的代码为Naive ...

回答 1 投票 0

准确率和预测分类器

我已经在我的数据集上训练了LSTM和决策树(文本分类的类型)。我使用K-cross fold验证,k=10。决策树准确率61% LSTM准确率90% 现在当我预测...

回答 1 投票 -1

如何在tensorflow上修复文本分类的学习率?

我一直在用 tensorflow keras 编码情感分析模型,我使用的是 csv 数据集,其中第 1 行有标签(pos:1, neg:0),第 2 行有英文文本。我使用csv数据集,其中第1行是标签(pos:1, neg:0),第2行是英文文本。 我期望的结果是显示数字 ...

回答 1 投票 1

文本分类的SkLearn模型

我有一个分类器多类,使用Sklearn库提供的LinearSVC模型进行训练。这个模型提供了一个decision_function方法,我用numpy库的函数来解释 ...

回答 3 投票 3

使用sklearn预测新内容的文本群集。

我想了解如何使用sklearn创建文本的聚类。我有800百个文本(600个训练数据和200个测试数据),如下所示。文本#列名称1唐纳德-特朗普,... ...

回答 1 投票 1

预期字节或单码字符串

我一直在尝试做文本分类。有2列行动和类别。我已经把数据集分为训练和测试分裂.有某种np.nan是一个无效的文件,预计... ...

回答 1 投票 0

在文本分类的任务中,如何编写管道的特征提取器类?

我在做一个文本作者归属模型。分类器是SVM(线性核),我想使用sklearn.model_selection中的cross_val_score进行评估。问题是如何反馈到 ...

回答 1 投票 0

如何在TensorFlow 2.0中优化微调后BERT的模型大小?

在对分类的BERT进行微调后,模型大小是~1.3GB,而预训练的模型大小是~400MB。这种情况的发生是由于模型中保存了与Adam相关的附加变量,可以 ...

回答 1 投票 0

替代品TfidfVectorizer

有什么办法可以替代sklearn.feature_extraction.text模块的TfidfVectorizer功能吗?我听说过fastText和GloVe,但是没有找到一个好的解释如何使用它来矢量化......

回答 1 投票 0

使用fastText进行文本分类的文本预处理。

对于使用fastText进行监督文本分类,什么样的文本预处理能产生最好的效果?官方文档显示只有一个简单的预处理,包括小写字母和 ...

回答 1 投票 0

如何使用卷积神经网络(python)构建深度学习文本分类器?

我需要采取哪些步骤来构建一个深度学习文本分类器,更具体地说,是在一组未标记的文本中识别作者(作者归属)的文本分类器? ...

回答 1 投票 1

提高邮件分类的准确性?

我正在建立一个邮件分类模型。目前,我在数据的预处理过程中使用了NLTK的stopwords和lemmatization。以下是我正在使用的TF-IDF向量器的参数 ...

回答 1 投票 0

多标签分类中的Spacy TextCat Score。

在spacy的文本分类 train_textcat例子中,指定了两个标签Positive和Negative。因此,猫的得分表示为cats = [{"POSITIVE": bool(y), "NEGATIVE": not ...

回答 1 投票 0

如何从一个来自Monkeylearn的API响应的python子列表中只提取一个特定的值。

我一直在Monkeylearn中训练一个文本分类模型,作为我的API查询的响应,我得到一个python列表作为结果。我想只提取特定的文本分类值,从 ...

回答 1 投票 0

使用tensorflow进行句子分类实现HuggingFace BERT

我正在尝试使用Hugging face bert模型对推文进行分类来训练实际灾难推文预测模型(Kaggle竞赛)。我遵循了许多教程,并使用了...

回答 1 投票 0


删除停用词并仅选择熊猫中的名字

我正在尝试按日期提取热门单词,如下所示:df.set_index('Publishing_Date')。Quotes.str.lower()。str.extractall(r'(\ w +)')[0] .groupby( 'Publishing_Date')。value_counts()。groupby('Publishing_Date')...

回答 1 投票 1

如何使用Tf-idf功能训练模型?

从sklearn.feature_extraction.text导入TfidfVectorizer tfidf = TfidfVectorizer(sublinear_tf = True,min_df = 5,范数='l2',...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.