nlp 相关问题

自然语言处理(NLP)是人工智能的子领域,涉及从自然语言数据转换或提取有用信息。方法包括机器学习和基于规则的方法。

改进Gensim Doc2vec结果

我尝试在600000行句子上应用doc2vec:代码如下:来自gensim import models model = models.Doc2Vec(alpha = .025,min_alpha = .025,min_count = 1,workers = 5)model.build_vocab(res)。 ..

回答 1 投票 4

Wordnet查找同义词

我正在寻找一种使用wordnet查找特定单词的所有同义词的方法。我正在使用JAWS。例如:爱(v):佩服,崇拜,依恋,被迷住,疯狂,成为......

回答 4 投票 12

斯坦福nlp:解析树

我有这句话:我的狗也喜欢吃香肠。我得到以下解析树:(ROOT(S(NP(PRP $ My)(NN狗))(ADVP(RB也))(VP(VBZ喜欢)(S(VP(VBG吃)...

回答 1 投票 3

在Python 3中遇到了正则表达式子函数的问题

我试图从我从网站下载并使用BeautifulSoup解析的文本中删除\ x92,\ xa0等符号。然后我看到我到处都有这些符号(编码)。我是 ...

回答 1 投票 -1

在Keras实现word2vec

我想在keras中实现word2vec算法,这可能吗?我该如何适应模型?我应该使用自定义丢失功能吗?

回答 1 投票 10

在spacy中,是否可以在匹配匹配中获取相应的规则ID

在Spacy 2.x中,我使用匹配器在我的文本语料库中查找特定的标记。每个规则都有一个ID(例如'class-1_0')。在解析期间,我使用回调on_match来处理每个匹配。有没有 ...

回答 2 投票 4

列表索引必须是整数或切片而不是str-HMM前向算法

我正在尝试实现前向算法以计算HMM。我正在一步一步地调试每一步但我得到一个错误。任何人都可以告诉我错误是什么?我的代码是:...

回答 1 投票 0

NLP从HTML到文本的预处理

我看到NLTK建议使用BeautifulSoup get_text()将HTML预处理为文本,以便进行后续的NLP分析。但它似乎并没有很好地发挥作用。在以下示例中,xyz和abc是......

回答 1 投票 2

如何使用神经网络和python自动从文本创建布尔值

我在文本文件中有几个句子,如下所示。 1)篮子里必须有面包和果酱2)可能含有任何水果(如橙子,苹果,葡萄等),现在我想得到......

回答 1 投票 -2

检查python中的postag模式

我想检查给定的单词是否由NN构成。如果所有都是NN增加计数值。例如,如果我的单词是[('micro','NN'),('blog','NN'),('texts','NN')]我应该......

回答 1 投票 1

使用TFRecords文件预处理文本数据

我有一个.tfrecord数据集的文本文件(电子邮件),相应的标签为'0'或'1'(垃圾邮件/非垃圾邮件)。所有这些数据集都已经是.tfrecord文件的形式。我试图改变......

回答 1 投票 0

gensim文档相似性:如何从最相似的结果中获取文档标题?

我正在使用gensim来分析大型语料库中的文档相似性。每个文档都有一个“标题”,或者更具体地说,一个唯一的ID字符串,以及内容文本。看了好几个......

回答 1 投票 0

我可以多次训练我的分类器吗?

我正在使用nltk和sklearn构建一个基本的NLP程序。我在数据库中有一个大型数据集,我想知道训练分类器的最佳方法是什么。是否可以下载...

回答 1 投票 1

如何在Wordnet中获取Synset偏移量以用于Imagenet

我计划使用Image-Net构建语言任务的同义词列表。根据Image-Net API文档,ImageNet基于WordNet 3.0。要唯一标识一个synset,我们使用“WordNet ID”...

回答 1 投票 5

“拼写检查”并在Python中返回更正的术语

我最近从pdf文件目录中提取了文本数据。阅读pdf时,有时返回的文本有点乱。例如,我可以看到一个字符串,上面写着:“他......

回答 2 投票 2

如何在nlp中解析时检索子树

我想在解析句子时检索子发辫,如下所示:sentence =“所有新药物必须经过测试才能开出处方”parser = stanford ....

回答 1 投票 1

Sci-Kit学习:将朴素贝叶斯模型预测纳入Logistic回归?

我有关于各种客户属性(自我描述和年龄)的数据,以及这些客户是否会购买特定产品的二进制结果{“would_buy”:“否”,“自我描述”:“我是......

回答 1 投票 2

如何从文本语料库中删除特定的单字组,但仍保留该单词的双字组?

我有这样的情况,我必须从文本语料库中删除特定单词unigram,同时保持该单词的双字符以及该单词的单词。我想传递一个文本地址......

回答 1 投票 0

如何使用Keras LSTM与word嵌入来预测单词id

在Keras中使用单词嵌入时,我在理解如何获得正确输出时遇到问题。我的设置如下:我的输入是批量形状(batch_size,sequence_length)。 ......中的每一行

回答 1 投票 1

经常性NN:参数共享的重点是什么?无论如何填充都不起作用?

刚刚开始研究RNN和LSTM ......我所看到的任何资源都没有回答过一个问题:以下是我如何理解RNN中参数共享的重点。我......

回答 1 投票 2

© www.soinside.com 2019 - 2024. All rights reserved.