nlp 相关问题

自然语言处理(NLP)是人工智能的子领域,涉及从自然语言数据转换或提取有用信息。方法包括机器学习和基于规则的方法。

如何使用 `langchain.document_loaders.PyPDFLoader` 来处理在 StreamLit 上上传的 pdf 文档?

我正在尝试使用 StreamLit 构建一个 web 应用程序来读取文档(主要是 pdf)并使用 langchain.document_loaders.PyPDFLoader 加载数据,但最终出现错误,如下所示: 类型错误:

回答 2 投票 0

如何在 CSV 或 PDF 文件上微调 PrivateGPT 的输出,以仅获取必需的单词或数字,以便将其保存在 txt 文件中

我目前正在做一个项目。我的一个好朋友在一家会计师事务所工作。我看到一个需要太多人力的问题。就像人们会阅读银行对账单一样,对电子产品进行分类...

回答 1 投票 0

从 Jupyter Notebook 中的 nltk 库导入停用词时出错

我是 NLP 的初学者,尝试使用 nltk.download('stopwords') 但我收到无效的网址错误,我也尝试了其他答案,但我没有得到任何可行的解决方案。 导入 nl...

回答 1 投票 0

如何构建 Jira AI 聊天机器人?

我的公司在过去 6~8 年里一直使用 Jira 进行生产问题跟踪,因此,我们的 Jira 中记录了大量生产问题详细信息。 通常每张 Jira 门票...

回答 2 投票 0

如何删除错误“SystemError:_internal 初始化失败而不引发异常”

我正在尝试导入 Top2Vec 包以进行 nlp 主题建模。但即使升级了pip、numpy这个错误还是来了。 我试过 pip 安装 --升级 pip pip install --升级 numpy 我期待着...

回答 5 投票 0

GooglePalm()。 NotImplementedError:需要确定要使用哪个默认弃用计划。之内 ??小版本发布

此代码之前工作正常,现在使用 langchain 调用 GooglePalm 时会引发此错误。 错误: ----> 8 llm = GooglePalm()。 NotImplementedError:需要确定哪个默认值

回答 1 投票 0

model.resize_token_embeddings()函数如何重构tokenizer中新添加的token的嵌入?

我是自然语言处理的新手,目前正在使用 Hugging Face 的 ALMA-7B 模型进行机器翻译。我想根据我的

回答 1 投票 0

/usr/bin/python:没有名为 spacy 的模块

我已经安装了Rasa和spacy。但是当我尝试通过下面的命令下载时 python -m spacy 下载 en_core_web_md 在我的 Mac 上,它显示: /usr/bin/python:没有名为 spacy 的模块 你可以吗

nlp
回答 2 投票 0

NHunspell - 如何生成所有识别的单词?

NHunspell 是否可以生成所有已识别/有效单词的列表?据我记得可以从命令行使用 hunspell (unmunch)。 从当前的 hunspell 文档来看...

回答 1 投票 0

无法标记文本文件的POS

我想标记句子的词性。对于此任务,我使用 pos-english-fast 模型。如果有一个句子,模型就会识别出该位置的标签。我创建了一个数据文件,其中我...

回答 1 投票 0

是否有任何最佳实践来为基于文本的分类准备特征?

我们有很多客户的反馈和问题报告。它们是纯文本。我们正在尝试为这些文档构建一个自动分类器,以便将来的反馈/问题可以自动路由到正确的

回答 2 投票 0

为 RAG 的 Llama 2 添加自定义提示

我已经在本地下载了 Llama 2 并且可以运行。现在我想调整我的提示/更改默认提示以强制 Llama 2 使用不同的语言(例如德语)进行回答。这是我的代码: 来自 langc...

回答 1 投票 0

Tensorflow 拼写校正模型的错误预测

我训练了一个用于拼写纠正的 Tensorflow 模型。我训练了 > 60 个 epoch,准确率达到约 82.2%,损失为 0.3032。当我尝试用模型进行预测时,它没有

回答 1 投票 0

拥抱脸的 Transformer 模型在 Google Colab 上没有给出所需的输出

我尝试运行模型“AdapterHub/bert-base-uncased-pf-conll2003”(此处模型描述)进行 NLP 中的标记分类。我使用 Google Colab 来完成这项任务。 代码块是 来自

回答 1 投票 0

抱脸的Transformer模型没有在Google Colab上运行

我尝试运行模型“AdapterHub/bert-base-uncased-pf-conll2003”(此处模型描述)进行 NLP 中的标记分类。我使用 Google Colab 来完成这项任务。 首先我尝试安装

回答 1 投票 0

错误:无法安装 en-core-web-trf,因为这些软件包版本具有冲突的依赖项

我使用以下命令(来自spacy网站)在Windows 10 home 64位下安装spacy和en_core_web_trf,但是,我在运行最后一个(第三行)co时遇到了问题...

回答 3 投票 0

无法为camel-kenlm建造轮子

错误:camel-kenlm 构建轮子失败 构建camel-kenlm失败 错误:无法为camel-kenlm 构建轮子,这是安装基于 pyproject.toml 的项目所必需的 尝试过: python -m pip

回答 1 投票 0

Luong 注意力和 Bahdanau 注意力有什么区别?

这两个注意力机制被用在seq2seq模块中。在此 TensorFlow 文档中,将两种不同的注意力作为乘法注意力和加性注意力进行介绍。有什么区别?

回答 6 投票 0

2-3 个单词的短语与多个句子的文档之间的句子相似度

我想要实现的目标:我有数千个文档(事件描述),我想找到与短语匹配或与短语中的单词相似的文档。举个例子,...

回答 1 投票 0

抱脸| tokenizer.batch_encode_plus 不同数据集上的列不一致

我目前使用 tokenizer.batch_encode_plus 并且相同的标记器应用于不同的数据集/文本列表。 df_train_feats 和 df_test_feats 产生不同的列长度。 df_test_feats...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.