自然语言处理(NLP)是人工智能的子领域,涉及从自然语言数据转换或提取有用信息。方法包括机器学习和基于规则的方法。
如何使用 `langchain.document_loaders.PyPDFLoader` 来处理在 StreamLit 上上传的 pdf 文档?
我正在尝试使用 StreamLit 构建一个 web 应用程序来读取文档(主要是 pdf)并使用 langchain.document_loaders.PyPDFLoader 加载数据,但最终出现错误,如下所示: 类型错误:
如何在 CSV 或 PDF 文件上微调 PrivateGPT 的输出,以仅获取必需的单词或数字,以便将其保存在 txt 文件中
我目前正在做一个项目。我的一个好朋友在一家会计师事务所工作。我看到一个需要太多人力的问题。就像人们会阅读银行对账单一样,对电子产品进行分类...
从 Jupyter Notebook 中的 nltk 库导入停用词时出错
我是 NLP 的初学者,尝试使用 nltk.download('stopwords') 但我收到无效的网址错误,我也尝试了其他答案,但我没有得到任何可行的解决方案。 导入 nl...
我的公司在过去 6~8 年里一直使用 Jira 进行生产问题跟踪,因此,我们的 Jira 中记录了大量生产问题详细信息。 通常每张 Jira 门票...
如何删除错误“SystemError:_internal 初始化失败而不引发异常”
我正在尝试导入 Top2Vec 包以进行 nlp 主题建模。但即使升级了pip、numpy这个错误还是来了。 我试过 pip 安装 --升级 pip pip install --升级 numpy 我期待着...
GooglePalm()。 NotImplementedError:需要确定要使用哪个默认弃用计划。之内 ??小版本发布
此代码之前工作正常,现在使用 langchain 调用 GooglePalm 时会引发此错误。 错误: ----> 8 llm = GooglePalm()。 NotImplementedError:需要确定哪个默认值
model.resize_token_embeddings()函数如何重构tokenizer中新添加的token的嵌入?
我是自然语言处理的新手,目前正在使用 Hugging Face 的 ALMA-7B 模型进行机器翻译。我想根据我的
/usr/bin/python:没有名为 spacy 的模块
我已经安装了Rasa和spacy。但是当我尝试通过下面的命令下载时 python -m spacy 下载 en_core_web_md 在我的 Mac 上,它显示: /usr/bin/python:没有名为 spacy 的模块 你可以吗
NHunspell 是否可以生成所有已识别/有效单词的列表?据我记得可以从命令行使用 hunspell (unmunch)。 从当前的 hunspell 文档来看...
我想标记句子的词性。对于此任务,我使用 pos-english-fast 模型。如果有一个句子,模型就会识别出该位置的标签。我创建了一个数据文件,其中我...
我们有很多客户的反馈和问题报告。它们是纯文本。我们正在尝试为这些文档构建一个自动分类器,以便将来的反馈/问题可以自动路由到正确的
我已经在本地下载了 Llama 2 并且可以运行。现在我想调整我的提示/更改默认提示以强制 Llama 2 使用不同的语言(例如德语)进行回答。这是我的代码: 来自 langc...
我训练了一个用于拼写纠正的 Tensorflow 模型。我训练了 > 60 个 epoch,准确率达到约 82.2%,损失为 0.3032。当我尝试用模型进行预测时,它没有
拥抱脸的 Transformer 模型在 Google Colab 上没有给出所需的输出
我尝试运行模型“AdapterHub/bert-base-uncased-pf-conll2003”(此处模型描述)进行 NLP 中的标记分类。我使用 Google Colab 来完成这项任务。 代码块是 来自
抱脸的Transformer模型没有在Google Colab上运行
我尝试运行模型“AdapterHub/bert-base-uncased-pf-conll2003”(此处模型描述)进行 NLP 中的标记分类。我使用 Google Colab 来完成这项任务。 首先我尝试安装
错误:无法安装 en-core-web-trf,因为这些软件包版本具有冲突的依赖项
我使用以下命令(来自spacy网站)在Windows 10 home 64位下安装spacy和en_core_web_trf,但是,我在运行最后一个(第三行)co时遇到了问题...
错误:camel-kenlm 构建轮子失败 构建camel-kenlm失败 错误:无法为camel-kenlm 构建轮子,这是安装基于 pyproject.toml 的项目所必需的 尝试过: python -m pip
这两个注意力机制被用在seq2seq模块中。在此 TensorFlow 文档中,将两种不同的注意力作为乘法注意力和加性注意力进行介绍。有什么区别?
我想要实现的目标:我有数千个文档(事件描述),我想找到与短语匹配或与短语中的单词相似的文档。举个例子,...
抱脸| tokenizer.batch_encode_plus 不同数据集上的列不一致
我目前使用 tokenizer.batch_encode_plus 并且相同的标记器应用于不同的数据集/文本列表。 df_train_feats 和 df_test_feats 产生不同的列长度。 df_test_feats...