nlp 相关问题

自然语言处理(NLP)是人工智能的子领域,涉及从自然语言数据转换或提取有用信息。方法包括机器学习和基于规则的方法。

如何可视化注意力权重?

使用此实现 我已经将注意力纳入了我的 RNN(它将输入序列分为两类),如下所示。 可见=输入(形状=(250,)) 嵌入=嵌入(vocab_size,100)(可见...

回答 2 投票 0

给定上下文中最相似的单词

我想创建一个可以生成上下文感知同义词的深度学习模型。我一直在考虑使用 BERT,因为它是双向的并且可以创建良好的表示,我的想法是...

回答 2 投票 0

正则表达式捕获新行的意外行为(python)

我正在尝试在大量文本中查找包含 4 个单词或更少且以“:”结尾的行。文本混乱,因此任何空格都可能出现在行的开头或结尾(我...

回答 2 投票 0

如何从字符串中提取“单词形式的数字”

有人知道从哪里开始吗? 例如,从“我有两个苹果”中提取“二”。 我正在寻找NLP或QDA的方向。任何有关如何进行的线索将不胜感激。

回答 3 投票 0

注意层在推理时改变批量大小

我使用编码器-解码器架构训练了序列到序列模型。我正在尝试在给定输入上下文的情况下生成输出序列,并且我正在尝试对一批输入上下文向量执行此操作。 ...

回答 1 投票 0

AutoModelForSequenceClassification 与 AutoModel 之间有什么区别

我们可以通过 AutoModel(TFAutoModel) 函数创建模型: 从 Transformers 导入 AutoModel 模型 = AutoModel.from_pretrained('distilbert-base-uncase') 另一方面,模型是由

回答 2 投票 0

Transformer 培训如何实施教师强制?

在 Tensorflow 教程的这一部分中,他们提到他们正在使用教师强制进行训练。据我所知,教师强迫涉及将目标输出输入到模型中,以便它

回答 2 投票 0

带有步幅的预训练模型不能预测长文本

我的目标是用bioformer-8L注释长文档。据说我使用了跨步和截断,这样我就不必将我的文档分成 512 个标记的块。 在训练阶段,我...

回答 1 投票 0

用于 TensorFlow 中大型数据集预处理的内存高效 BERT 文本嵌入

我正在处理包含大约 920,614 行和多列的数据集,包括“orig_item_title”、“sub_item_title”、“is_brand_same”和“

回答 1 投票 0

使用langchain和LLaMA2对大型SQL数据库进行QA

我正在使用为大型数据集(约 150k 行)创建的 sqlite 数据库。 代码片段: db = SQLDatabase.from_uri("sqlite:///MLdata.sqlite") SQLITE_PROMPT_TEXT = '''你是一个 SQLite

回答 1 投票 0

微调小队中的 T5 模型

目标:在 SQUAD 数据集上微调 T5 以提取问题和答案 问题:如果我的标记化数据集包含 input_ids、attention_mask、targets_ids 和 target_attention_mask,为什么是训练器

回答 1 投票 0

修改 tidytext get_sentiments() 中某些单词的情绪

我正在尝试修改我的 df 中一些特定单词的情感,使它们更适合我的上下文,它们在我的上下文中使用时带有负面含义,但已被归类为具有

回答 1 投票 0

NLP 预处理 Data Frame 中的文本,正确的顺序是什么?

我正在尝试预处理具有两列的数据框。每个单元格包含一个字符串,称为“标题”和“正文”。 基于这篇文章我尝试重现预处理。怎么...

回答 1 投票 0

spaCy 使用 anvil.works 服务器显示输出

我正在尝试使用 spaCy 的显示功能来显示实体。 我的渲染输出与我的 anvil.server.wait_forever() 代码一起显示在我的 Jupyter Notebook 代码单元中。 这是一个考试...

回答 1 投票 0

bert如何是双向的?

Bert 编码器接受输入并进入多头注意力模型。但它们如何保持顺序呢?由于当前单词不采用先前单词的顺序。另外,为什么是双向的...

回答 2 投票 0

AttributeError:“TFBERtModel”对象没有属性“parameters”

你好,我正在尝试为我训练过的分词器训练 Bert 模型。我导入了 从变压器导入 TFBertModel 模型 = TFBertModel.from_pretrained("bert-base-uncased") 现在我...

回答 1 投票 0

是否存在一个好的通用生产级变压器模型微调脚本?

是否存在用于微调生成语言(变压器)模型的通用脚本? 它可以基于支持加载许多不同模型的库(例如 HuggingFace)。 我...

回答 1 投票 0

X 有 95812 个特征,但 RandomForestClassifier 期望有 178341 个特征作为输入

我有一个使用文本数据的随机森林模型。但是,当我在新数据(测试集)上尝试该模型时,训练集和测试集之间的特征数量不兼容。还有,转变...

回答 1 投票 0

如何构建模型并使用张量流 keras 子类进行训练

我编写了一个自定义编码器和解码器层,它实现了《Attention Is All You Need》论文中描述的架构。一切正常,直到我尝试编译它,我得到一个呃......

回答 1 投票 0

如何在bertopic建模中获取每个主题的所有文档

我有一个数据集,并尝试使用 berTopic 建模将其转换为主题,但问题是,我无法获取主题的所有文档。 berTopic 每个主题仅返回 3 个文档。 主题模型 =

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.