自然语言处理(NLP)是人工智能的子领域,涉及从自然语言数据转换或提取有用信息。方法包括机器学习和基于规则的方法。
我的 gpt2 代码生成了一些正确的单词,然后进入一个循环,一次又一次地生成相同的序列
以下用于句子补全的 gpt2 代码生成了一些好句子,然后以重复句子的循环结束。 从变压器导入 GPT2LMHeadModel,GPT2Tokenizer ...
我要求 Wordnet(在 python 脚本中)列出所有现有的荷兰语动词,但我的输出是空的。有什么想法吗?
我想提取荷兰语中的所有动词,为此我使用了 Wordnet。 我写了下面的代码,但结果仍然没有输出,因为 dutch_verbs 列表是空的! 知道为什么......
假设创建一个 AI 工具,用户在其中上传文件到工具中,工具给出输出。 当数据未知时,请帮助我进行自动数据清理的方法
我想对没有标点符号的句子进行分词,代码如下: 导入 nltk def segment_sentences(文本): # 如有必要,下载 Punkt 分词器 nltk.downl...
#我在做主题建模 但是在计算每个主题的概率时,总和不等于 #矢量器 ctfidf = ClassTfidfTransformer() bow = CountVectorizer(ngram_range=(1,3))#减少
我想为使用我的aibot的用户制作一个个性化的知识图谱来刺激智能物联网家庭。就像他每天晚上 9 点关灯,所以在了解他之后,我的系统应该告诉他打开...
句子转换器 - KeyError:__version__ error: What are some alternatives?
我正在尝试将句子转换器与 all-miniLM-L6-v2 模型一起用于主题建模,但出现错误 关键错误:版本 我已经检查了所有下载文件的目录,它有...
我需要手动注释一些文档(为 NER 任务标记自定义实体)。 我需要一个可以帮助我进行自动(半自动)标记的工具。 我试过 Doccano 但它没有
ent.sent.text in spacy 返回标签而不是 NER 问题的句子
我正在尝试使用 PDF 文件的 SpaCy 解决名称实体识别(NER)问题。我想从 pdf 文件中获取情态动词(will、shall、should、must 等)。 我在 sp 中训练了数据...
我正在寻找一个可以根据给定上下文生成问题答案的模型。目前,我有一个可用的法语数据集,但它是原始格式,没有任何预定义的问题或...
我有一个数据集,数据集中的每个样本都是 ,答案可能在文档中,现在,我想使用 BiLSTM 实现模型并注意。 该模型有两个输入 l...
C3W2_Assignment in coursera深度学习课程NLP
评分员要求的单元格 分级功能:tokenize_labels def tokenize_labels(all_labels, split_labels): """ 标记标签 参数: all_labels(字符串列表):要生成的标签...
微调 SentenceTransformer/SBERT 以提取文本摘要
NLP 新手。 我想构建提取文本摘要,尝试阅读这个 https://huggingface.co/blog/how-to-train-sentence-transformers,我认为有一种方法可以通过...微调模型
我正在寻找使用语言模型为表格的每一行生成摘要的方法。 GPT3.5确实支持table to text(数据到文本)生成但是我想把模型保存到本地然后
我正在使用 wordninja Python 包中的 wordninja.split() 来分隔拼凑在一起的句子,但是,它也会从句子中删除句号。我怎样才能防止这种行为?我
使用 tesseract 或 easyocr aur nlp 或 ai 将图像转换为 csv
在这里输入图片描述请帮助我我有下面的图片我想在csv中我已经从图片中提取所有文本但无法放入csv这是我正在使用的代码但我无法放入...
如何在维护构成每个句子的字符串的信息的同时对字符串列表进行句子标记?
我有如下字符串列表(从 pdf 上的 OCR 找到),对于列表中的每个字符串,我也有它们在 pdf 中的位置坐标 [“新加坡的大部分基础设施......
transformer 训练损失没有减少 - Val。 Acc/cy 停留在 0.58
我正在训练一个基于多分支 pytorch 的深度伪造检测管道。我正在尝试实现本文中介绍的以下模型: 基于 Transformer 的 DeepFake 检测方法 对于
我正在尝试写一个图像捕获模型,使用CNN模型提取图像特征,然后连接BERT和MLP生成一个长段落但是,经过训练,我的模型恢复...