nlp 相关问题

自然语言处理(NLP)是人工智能的子领域,涉及从自然语言数据转换或提取有用信息。方法包括机器学习和基于规则的方法。

Docker 构建时间过长且失败,requirements.txt 包含 TensorFlow 和其他包

我正在尝试构建我的 Docker 映像,但这需要很长时间。即使我让它继续构建,很长时间后它也会失败。这是我的 Dockerfile: 来自 ubuntu:24.04 # 安装Python并p...

回答 1 投票 0

在 python nlp 中删除窄“无间断空格”Unicode 字符 (U+00A0)

不间断空格被打印为空白,但在内部处理为 \xa0。如何一次删除所有这些字符? 到目前为止我已经直接替换了它: 文本 = 文本.replace('\u202f','') t...

回答 2 投票 0

文本分类。 TFIDF 和朴素贝叶斯? [已关闭]

我正在尝试执行文本分类任务,其中有大约 500 条餐厅评论的训练数据,这些评论被标记为 12 个类别。我花费的时间比实施 TF.IDF 的时间要长......

回答 1 投票 0

Transformer 语言模型中的关键矩阵冗余?

Transformer 语言模型的简单实现(例如此模型)定义 3 个矩阵 K、Q、V 来计算键、查询和值。然而矩阵 K 和 Q 永远不会单独使用:所有 Transformer

回答 1 投票 0

在 R 中将文本文件转换为数据框

R 有一个 .txt 文件,我想从中提取数据作为字符串。我的 .txt 文件的格式如下,其中包含由数字分隔的列表。 1. [文本1] 2. [文本2] 3. [文本3] a...

回答 1 投票 0

微调的 openAI API 给出 NotFoundError:错误代码:404

这是我的第一个openAI微调工作,所以我了解的不多。我正在尝试微调 OpenAI API 以根据描述生成产品 ID。代码运行成功,还生成了mode...

回答 1 投票 0

自然语言处理顶级会议

自然语言处理领域的顶级会议有哪些? 该领域最热门的话题是什么?

nlp
回答 2 投票 0

BertForSequenceClassification 使用的是 CLS 向量吗?

拥抱脸源码中,使用了pooled_output =outputs[1]。 输出 = self.bert( 输入ID, 注意掩码=注意掩码, token_type_ids=

回答 1 投票 0

如何在新版本中使用Spacy-PyTextRank?

我正在尝试使用TextRank进行关键短语提取,我安装了3.3.0版本,nltk和en_core_web_trf在3.7.3上,我不知道这是否是问题。 这是我得到的错误 小鬼...

回答 1 投票 0

如何优化这个功能,提高运行时间?

我的功能旨在创建一个包含三列的数据框;二元短语、计数(二元短语的)和 PMI 分数(二元短语的)。因为我想在大型数据集上运行它......

回答 1 投票 0

将多个句子传递给BERT?

我有一个包含段落的数据集,我需要将其分为两类。这些段落通常有 3-5 句话长。其中绝大多数的长度都不超过 500 字。我会...

回答 1 投票 0


为什么当测试的字符串100%包含查询字符串时,fuzzywuzzy的process.extractBests没有给出100%的分数?

我正在测试fuzzywuzzy的process.extractBests()如下: 来自 fuzzywuzzy 导入过程 # 定义查询字符串 查询=“苹果” # 定义选择列表 选择= [“苹果&...

回答 1 投票 0

NLTK 与距离度量一致

我的任务是计算多标签分类中注释者间的一致性,其中每个示例可以分配多个标签。我发现 NLTK 可以根据差异来衡量一致性...

回答 2 投票 0

从T5ForConditionalGeneration确定decoder_hidden_states的内容

我正在使用 Huggingface T5ForConditionalGeneration 模型,无需修改。 我想计算 T5 解码器最后一个隐藏状态的平均池化,但我无法确定

回答 1 投票 0

R 中的 FastText language_identification 返回太多参数 - 如何匹配文本?

FastText language_identification 返回每个原始文本的多个预测,并且也无法指示哪个属于哪个原始文档。 每个

回答 1 投票 0

Transformer:无法从“transformers”导入名称“AutoModelWithLMHead”

我指的是stackoverflow的这个答案,但我无法得到有关我的问题的任何线索:[https://stackoverflow.com/questions/63141267/importerror-cannot-import-name-automodelwithlmhead-from-

回答 3 投票 0

Android 机器学习库

我正在尝试为我的 Android 应用程序构建一个小型文本挖掘工具。我正在检查一个机器学习库,它可以让我进行聚类、分类等。 有没有机器学习库

回答 3 投票 0

如何在短时间内构建准确的数据集?

我们正在开发一款 iOS 应用程序,让用户可以发送可定制的数字卡片。用户可以从各种卡片模板中进行选择,输入自己的文本,并根据自己的喜好对卡片进行编辑。我们也有...

回答 1 投票 0

“寻求 Python 中高效 EDA 和大型数据集可视化的先进技术”

在提高数据分析和可视化技能的过程中,我一直在探索各种技术和工具来更有效地处理大型数据集。我一直在使用 Python、Pandas 和

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.