text-classification 相关问题

简单地说,文本分类就是将一段文本放入一组(主要是预定义的)类别中。这是许多现实世界应用中出现的最重要问题之一。例如,文本分类的一个示例是自动呼叫中心,其希望将投诉自动分类到最合适的问题桶中。

如何使用 Graph2Vec 嵌入应用文本分类?

我得到了一组文本文档,根据它们所属的主题按目录分隔。我想应用 Graph2Vec,然后使用每个文档的嵌入来训练文本分类...

回答 1 投票 0

产品分类问题,模型应该显示产品类别,但显示数值

train.py 将 pandas 导入为 pd 进口再 导入nltk 从 nltk.corpus 导入停用词 从 nltk.stem 导入 PorterStemmer 从 sklearn.model_selection 导入 train_test_split 来自 sklearn.pipeline 我...

回答 1 投票 0

如何在加州大学伯克利分校安然电子邮件分析数据集上查找“约 1700 封带标签电子邮件的子集”中给出的电子邮件的类别?

我正在使用此网站 https://bailando.berkeley.edu/enron_email.html 的数据集“大约 1700 条标记电子邮件的子集” 但我很困惑如何找到

回答 1 投票 0

R 中使用正则表达式进行确定性分类?

我有正则表达式列表: 正则表达式_列表 <- list("First Name" = "^[A-Za-z]+$", "Postal Code" = "^[0-9]{5}$", &

回答 1 投票 0

如何将评估指标从 ROC AUC 更改为 Hugging Face Transformers 微调中的准确度?

我目前正在使用 Python 中的 Hugging Face Transformers 库执行文本分类任务。我的代码设置为使用 ROC AUC 作为评估指标,但我需要将其更改为acc...

回答 1 投票 0

文本分类中模型的输入参数为字符串

我正在使用 scikit-learn 构建文档分类系统,它运行良好。我正在将模型转换为 Core ML 模型格式。但模型格式除了输入参数为multiArrayT...

回答 2 投票 0

ValueError:分类指标无法处理多类和多标签指标目标的混合

我有带有 2000 个不同标签的多类标记文本分类问题。使用 LSTM 和 Glove Embedding 进行分类。 目标变量的标签编码器 带有嵌入层的 LSTM 层

回答 2 投票 0

机器学习文本分类技术

我有大量(比如说3000个)关键词。这些关键词需要分为七个固定类别。每个类别都有训练数据(样本关键词)。我需要一个算法,当一个新的关键词...

回答 5 投票 0

如何在文本分类中使用不同的数据集进行训练和测试,同时避免特征数量不匹配?

我正在使用两个不同的数据集进行文本分类,目的是使用一个数据集进行训练,使用另一个数据集进行测试。请注意,我不想合并数据集以防止...

回答 1 投票 0

如何使用不同(未分割)的数据集在Python文本分类中进行训练和测试,同时避免特征数量不匹配

嗨,善良且乐于助人的人们, 我正在使用两个不同的数据集进行文本分类,目的是使用一个数据集进行训练,使用另一个数据集进行测试。请注意,我不想合并...

回答 1 投票 0

微调序列分类模型时出现隐秘的 CUDA 错误

我正在使用 QLoRA 微调 Llama 2 7B 以进行序列分类。我使用单个 A100 GPU,即使增加到多个 GPU、增加 CPU,也会出现相同的神秘 CUDA 错误

回答 1 投票 0

Transformer 模型表现不佳(PyTorch)

我正在开展变压器模型的培训工作,其任务是评估用户的英语水平。 我拥有的数据集是学生编写的文本。运行训练时,训练准确度可达...

回答 1 投票 0

如何根据元音和辅音的序列将字符串分类为“好”、“坏”和“混合”

我想将字符串分为三种类型:好、坏或混合。如果一个字符串有 3 个连续的元音或 5 个连续的辅音,或者两者都有,那么它就被归类为坏字符串。否则就是类别...

回答 3 投票 0

是否有任何预训练的词嵌入可用于对源代码进行分类?

我正在尝试对从堆栈溢出中获取的源代码片段语料库进行分类。我正在探索各种技术,例如 Tf-Idf、带有 CNN 的 keras 嵌入层、bert 等。 由于源代码分类...

回答 1 投票 0

AI模型推理的最低系统要求

我如何确定运行 pytorch 模型推理的最低系统要求以避免内存不足(OOM)? 例如,我有一个微调的文本分类模型(“sentiment_mod...

回答 1 投票 0

为什么我的火车测试比例无法达到 99:1?我的测试集的大小真的很重要吗?

我一直在训练 Spacy textcat 管道组件以用于多标签文本分类。当我训练和更新模型时,我一直在不断减小测试集的大小,因为我的

回答 0 投票 0

为什么神经网络需要词嵌入?

当我们使用词嵌入对文档进行向量化时,为什么需要神经网络来进行文本分类?如果词嵌入捕获了单词/文档的含义,那么为什么我们不能只使用 cos...

回答 0 投票 0

Transformer 模型进行文本分类的准确性较低

我正在运行一个使用 Transformer 模型进行葡萄牙语文本分类的脚本。 问题是准确性并没有随着训练而提高,它保持在接近随机的百分比

回答 0 投票 0

ModuleNotFoundError:没有名为“transformers.models.mmbt”的模块

从简单的转换器导入分类模型时,我收到此错误。请让我知道如何解决这个问题 ModuleNotFoundError Traceback(最近的调用...

回答 0 投票 0

HuggingFace 评估微调零样本模型

我正在微调 HuggingFace facebook/bart-large-mnli 模型以满足我的需要,我使用以下参数: training_args = TrainingArguments( output_dir=model_directory, # 输出目录...

回答 0 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.