nlp 相关问题

自然语言处理(NLP)是人工智能的子领域,涉及从自然语言数据转换或提取有用信息。方法包括机器学习和基于规则的方法。

有没有办法让langchain中的LLM仅根据提供的上下文(pdf)回答问题?

iam 尝试使用 langchain 与多个 pdf 系统进行聊天,但如果我向机器人询问提供的 pdf 中的问题,它会根据 llm 预训练的知识进行回答,我希望它只回答

回答 1 投票 0

从词汇表中找出单词

我在 pandas 数据框中有一些文本 df['mytext'] 我还有一个词汇表(单词列表)。 我正在尝试列出并计算每个文档词汇表中的单词 我已经尝试过

回答 1 投票 0

在word2vec模型中测试时如何嵌入词汇?

我正在用 100 000 个词汇量训练我的 word2vec 模型(skip-gram)。但是在测试时,我得到了一些不在词汇表中的单词。为了找到它们的嵌入,我尝试了两种方法: 计算...

回答 1 投票 0

通过掩蔽和拥有多个正确标签来微调 BERT

我的目标是针对涉及简单算术运算(例如“5 + 3 = 8”或“7 加 2 等于 9”)的特定任务微调 BERT 模型。我的数据集包含数千个示例...

回答 1 投票 0

tf-idf 和以前未见过的术语

TF-IDF(词频 - 逆文档频率)是信息检索的主要内容。但这不是一个合适的模型,当新术语引入语料库时,它似乎就会崩溃......

回答 2 投票 0

如何提取由DecisionTreeClassifier()和plot_tree()创建的决策树中每个节点使用的单词?

我有以下数据用于训练模型来检测句子是否是关于: 一只猫或狗 与猫或狗无关 我运行以下代码来训练 DecisionTreeClassifier() 模型,然后 v...

回答 2 投票 0

为什么我在huggingface MT5模型中执行批量编码时得到不同的嵌入?

我正在尝试使用 HuggingFace 的 mt5 基础模型对一些文本进行编码。我正在使用如下所示的模型 从变压器导入 MT5EncoderModel、AutoTokenizer 模型 = MT5EncoderModel.from_pretrai...

回答 1 投票 0

TypeError:调用层“嵌入”时遇到异常(类型 TFBertEmbeddings)

我的模型在两周前完全可行,但现在显示以下错误: -------------------------------------------------- ------------------------ 类型错误...

回答 1 投票 0

AttributeError:“TokenClassifierOutput”对象没有属性“detach”

您能帮我解决以下错误吗:'TokenClassifierOutput'对象没有属性'detach'即使修改了像output = model(input_ids,

回答 2 投票 0

关于在大型文本数据集上训练法学硕士以从头开始生成文本的问题

我在 Jax 中(使用 Keras 3)制作了一个完全定制的 GPT,使用 Tensorflow 作为数据管道。 我已经在莎士比亚数据集上训练了模型并获得了良好的结果(因此模型没有问题)。 ...

回答 1 投票 0

使用哪个斯坦福 NLP 包进行内容分类>

我的表格中有大约 5000 个术语,我想将它们分组为有意义的类别。 例如一些术语是: 日产 福特 被捕 吉普车 法庭 结果应该是日产、福特、Jee...

回答 2 投票 0

无法进行网格搜索和训练模型

我正在研究基本的文本分类问题,我想使用堆叠分类器以及对基本分类器的参数进行一些微调以获得高精度结果。 我的数据集...

回答 1 投票 0

句子相似度模型未捕获相反的句子

我尝试了不同的句子相似度方法,即: spaCy 模型:en_core_web_md 和 en_core_web_lg。 变压器:使用句子相似度和句子变压器包,...

回答 3 投票 0

从 llama 索引导入 SimpleInputPrompt 时出错

代码: 从 llama_index.prompts.prompts 导入 SimpleInputPrompt ModuleNotFoundError Traceback(最近一次调用最后一次) 在 () 中 ----> 1 来自 llama_index.pr...

回答 1 投票 0

Spacy 手动下载 en_core_web_lg

我正在尝试找到一种方法来下载 Spacy == 2.3.2 的模型 en_core_web_lg ==2.3.1。 目前使用 python -m spacy 下载 en_core_web_lg 导入spacy nlp = spacy.load("en_core_web_lg&

回答 2 投票 0

如何让我的Python代码更有效?

我正在构建我的单词 n-gram 训练向量,稍后供 SVM 使用。我运行了我的代码,但是花了我太多时间,超过 10 个小时。你有什么方法可以让它更快吗? def wordNgrams(s,n):...

回答 1 投票 0

Transformers v4.x:将慢速分词器转换为快速分词器

我正在遵循 Transformer 的预训练模型 xlm-roberta-large-xnli 示例 从变压器进口管道 分类器 = pipeline("零样本分类", 我...

回答 5 投票 0

用于语义产品搜索任务的微调句子转换器

我手头的问题是构建一个产品建议模型,该模型根据用户搜索查询的上下文来建议产品。我的计划是从句子中获得一个预训练的模型 -

回答 1 投票 0

AttributeError:在 NLP 任务中调用 model.fit() 时,“tuple”对象没有属性“rank”

我正在关注这个教程 https://towardsdatascience.com/another-twitter-sentiment-analysis-with-python-part-9-neural-networks-with-tfidf-vectors-using-d0b4af6be6d7 然而,在实施的同时...

回答 1 投票 0

余弦相似度全部与 df 列中的全部:矢量化和存储结果?

我正在使用 pandas 数据框,我需要根据名为 text_original (~2k 行)的特定列中的文本内容计算所有行对之间的余弦相似度。我的目标...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.