nlp 相关问题

自然语言处理(NLP)是人工智能的子领域,涉及从自然语言数据转换或提取有用信息。方法包括机器学习和基于规则的方法。

Python:“Doc2Vec”对象没有属性“dv”

感谢您的建议,我已经编辑了问题 我遇到这个: AttributeError: 'Doc2Vec' object has no attribute 'dv' 错误来自 回溯(最近一次调用最后一次): 文件“F:\Projects\项目代码\

回答 2 投票 0

如何减少小数据集的计算时间?

我一直致力于文本检测作为我研究的一部分,重点关注各种特征。我遇到了计算时间的重大问题。我的数据集包含 3400 行和 2

回答 1 投票 0

如何进行标题预测?

我正在使用 python bert-base-uncased 模型基于句子创建标题。这是我写的代码。我需要根据 possible_labels 预测标题。难道是……

回答 1 投票 0

如何找到发音相似的单词?

我正在编写一个专门的(食品领域)多语言搜索引擎。 我使用 python 和 nltk 库。 我有一个相当大的食谱数据库,包含我想要支持的所有文化。 我问是否...

回答 1 投票 0

如何根据输入的问题内容查询相似度高的问题?

我有一个Java学生考试系统。 mysql数据库中有超过一百万个问题。题目内容由中文、英文、乳胶数学公式组成。 现在,我想要...

回答 1 投票 0

如何将具有自定义标准化功能的 Keras TextVectorization 层配置保存到 pickle 文件中并重新加载?

我有一个 Keras TextVectorization 层,它使用自定义标准化函数。 def custom_standardization(input_string,保留= ['[',']'],add = ['¿']): strip_chars = 字符串.标点符号 ...

回答 1 投票 0

python - TypeError:__init__() 得到意外的关键字参数“checkpoint_callback”

我收到此错误消息: TypeError Traceback(最近一次调用最后一次) 在 () 5 max_epochs=N_EPOCHS, ...

回答 2 投票 0

为什么Python会忽略列名中的符号?

我有一个如下所示的文本数据框 报告 ID、文本 1、+83 -193 -380 +55 +901 2、-94 +44 +2892 -60 3、+7010-3840+3993 虽然 Txt 字段有 +282 和 -829 但这些是字符串值...

回答 1 投票 0

如何制作可与 HuggingFace Transformers & Trainer 一起使用的“多头”回归数据加载器?

我正在研究一个多头回归问题,对于每个文本我想预测 5 个分数。您可以通过设置 Problem_type = 'regression' 来完成此操作,如变压器代码中所示 问题是...

回答 1 投票 0

检查一个文本有多少百分比可以在另一个文本中找到的有效方法?

所以到目前为止我一直在尝试几个库,但找不到适合代表我想要实现的目标的东西。我有两篇文本,其中一篇可能包含也可能不包含在 anot 中...

回答 1 投票 0

在Python中检测字母字符属于哪些

有没有库或其他简单的方法来检测Python中的字母字符属于哪些?我知道我可以为此使用 unicode 代码范围,但如果已经有内置方式或库或......

回答 2 投票 0

Python 中带有否定词的词袋

我有这份文件 这不是普通的文字 这是科学术语的文本 这些文件的正文是这样的 报告ID,文本 1、K9G3P9 4H477 -Q207KL41 98464 ... Q207KL41 2、D84T8X4 -D9W4S2 -

回答 1 投票 0

POS-Tagger 非常慢

我正在使用 nltk 通过首先删除给定的停用词来从句子生成 n-gram。然而,nltk.pos_tag() 非常慢,在我的 CPU(Intel i7)上最多需要 0.6 秒。 输出: ['第一个...

回答 4 投票 0

注意力中的掩码是否与位置编码执行相同的工作?

我是变压器解码器的新手,对注意力掩码感到困惑。它似乎掩盖了某个特定单词之前的所有单词。如果这就是它的作用,那么它是否会使网络位置变得糟糕......

回答 1 投票 0

使用语言模型进行后处理来提高提取的 PDF 文本质量的解决方案?

我创建了一个文本数据集,一种知识库,它是从大约 1000 个 PDF 中解析出来的,平均长度为 50 页。该数据集用于 RAG 实现。

回答 1 投票 0

如何使用GPT-2计算单词和句子嵌入?

我正在开发一个使用 GPT-2(特别是 GPT2Model 类)计算单词和句子嵌入的程序。对于词嵌入,我在转发后提取最后一个隐藏状态输出[0]...

回答 1 投票 0

设置可迭代错误时必须具有相等的 len 键和值

在将数据写入数据帧时,我遇到了这个问题“ValueError:使用可迭代设置时必须具有相等的 len 键和值”。这个 csv 有 98 行,我试图将值分配给...

回答 1 投票 0

NLP分句相对于Python算法有什么好处?

我在NLP中有一个任务要做一个句子切分,但我想知道,使用内置的NLP句子切分算法,例如Spacy,NLTK,BERT等,相对于Python'.'有什么优势?九月...

回答 2 投票 0

创意写作

我正在尝试查找有关创建可以理解英语单词、语法和上下文的基本 AI 工具(希望有 C# 源代码)的信息。 这个想法是通过使用尽可能多的

回答 7 投票 0

如何将适配器变压器与 Huggingface Pipeline 一起使用

我尝试运行模型“AdapterHub/bert-base-uncased-pf-conll2003”(此处模型描述)进行 NLP 中的标记分类。 首先我尝试安装适配器变压器 点安装...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.