nlp 相关问题

自然语言处理(NLP)是人工智能的子领域,涉及从自然语言数据转换或提取有用信息。方法包括机器学习和基于规则的方法。

为什么Seq2SeqTrainer在使用T5时评估时会产生错误?

按照此处的教程进行操作。我尝试使其适应我的数据集。 但是,我注意到在评估期间 Seq2SeqTrainer 调用了compute_metrics 3次。 第一次就通过了正确的

回答 2 投票 0

无法安装spacy==2.3.5版本

我尝试安装 spacy==2.3.5 作为简历分析程序。遇到用 pip 子进程安装构建依赖项没有运行成功的错误。 使用Python 3.12.3 它还给出了 E053

回答 0 投票 0

使用 gensim 下载器时,Fasttext 预训练模型不会生成 OOV 词向量

在尝试使用迄今为止发现的所有 fasttext 库(在 Windows 11 上的 Jupyter 和 Anaconda3 中)时,我遇到了很多麻烦,但这个问题主要是关于 gensim 的实现...

回答 1 投票 0

在包含数百万个字符的字符串中查找完全相同且相似的短语

我有一个短语列表和一个语料库,它是一串包含数百万单词的文本。对于我的短语列表中的每个短语,我想查找并记录在语料库中找到的最相似的短语...

回答 1 投票 0

如何在单个语料库中查找并保存短语列表中最相似的短语?

我有一个短语列表和一个语料库,它是一串包含数百万单词的文本。对于我的短语列表中的每个短语,我想查找并记录在语料库中找到的最相似的短语...

回答 1 投票 0

如何将Python循环输出保存到Excel文件

我有一个 Excel 文件(input.xlsx),其中包含两列(id 和 url)。 我对所有网址进行了网页抓取,并对文本进行了文本分析。 我有计算位置的函数...

回答 1 投票 0

用于将职位名称映射到标准化角色的推荐 NLP 技术和模型是什么?

我工作的一小部分涉及获取客户的员工数据集,并根据角色的头衔、层次结构中的假定职位将他们的职位映射到标准化头衔列表...

回答 1 投票 0

vLLM 存在 gemma-2b 输出问题

我正在尝试使用 vLLM 运行 gemma-2b 模型(就像此链接 https://docs.vllm.ai/en/latest/models/supported_models.html 中一样)。起初,我尝试使用 bf 以 gemma 的默认设置运行...

nlp
回答 1 投票 0

如何解决texthero安装错误?

当我尝试在 Google Colab 上 !pip 安装 texthero 时,发生以下错误,因此我无法导入 texthero。 pip安装代码 !pip 安装 texthero pip install 后出现错误的结果消息

回答 2 投票 0

为什么我们不能只使用Keys来计算self-attention?

我正在阅读有关自我注意机制的内容,论文建议需要计算 3 个东西:Key、Query 和 Value。据我了解,具有价值的原因是允许调整......

回答 1 投票 0

即使词序发生变化,我如何能够一致地将一个单词映射到句子中的另一个单词,例如将症状映射到受影响的器官?

例句: “胸部因呼吸困难而受到影响” 和 “呼吸困难影响胸部” 所需关系: “呼吸困难 -> 胸部” 我尝试过依赖匹配...

回答 1 投票 0

微调T5不收敛

我是 Transformer 和 NLP 领域的新手,在针对我的特定用例微调 T5 时遇到问题。 我想要实现的是,模型接收输入文本,并输出

回答 1 投票 0

如何在huggingface上使用从TFMarianMTModel转换而来的tflite模型

我正在寻找一个可以在 TFLite 中使用的 en-zh 翻译模型,我在 Huggingface 上找到了一个:https://huggingface.co/Helsinki-NLP/opus-mt-en-zh 我已通过以下方式将模型转换为 .tflite...

回答 1 投票 0

模糊句子搜索算法

假设我有一组短语 - 大约 10 000 - 平均长度 - 7-20 个单词,我想在其中找到一些给定的短语。我正在寻找的短语可能有一些错误 - 例如错过一个...

回答 2 投票 0

“ascii”编解码器无法解码位置 0 中的字节 0xef:序号不在范围内(128):BookNLP

我正在尝试在 Colab 中的 txt 文件上运行 BookNLP 模型,但我不断收到错误。 代码: input_file=“爱丽丝.txt” 输出目录=“爱丽丝” book_id=“爱丽丝” 书本LP。

回答 1 投票 0

语言中的from_messages、from_template、format、format_messages是什么?有人可以简化一下吗?

您能告诉我何时使用以及为什么使用上述功能吗? 我尝试阅读文档,但没有理解太多。对此的任何博客或链接的引用都是

回答 1 投票 0

如何将 AutoModelForCausalLM 对象转换为 dspy 模型对象?

导入dspy llm = dspy.HFModel(模型='模型') 如果我有 AutoModelForCausalLM 类的量化模型对象,则此方法采用字符串作为模型的输入 我如何将模型转换为...

回答 1 投票 0

词干过程中内核崩溃

我使用这个函数来进行句子词干提取 从 nltk.stem 导入 WordNetLemmatizer、PorterStemmer 从 nltk.tokenize 导入 word_tokenize 导入字符串 从 nltk.corpus 导入停用词 标点...

回答 1 投票 0

如何正确导入tensorflow-text

我在导入tensorflow-text时遇到了一系列错误。我首先尝试导入以下运行正常的版本。 !pip 安装tensorflow==2.8 但现在它是这样说的 `导入

回答 1 投票 0

ValueError:预期输入batch_size (2) 与目标batch_size (4) 匹配

这是我正在做的文本分类任务的代码。问题似乎就出在这里。这是一个多类问题。我有3个标签。我尝试了几件事。我将标签的格式更改为

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.