nlp 相关问题

自然语言处理(NLP)是人工智能的子领域,涉及从自然语言数据转换或提取有用信息。方法包括机器学习和基于规则的方法。

使用TFRecords文件预处理文本数据

我有一个.tfrecord数据集的文本文件(电子邮件),相应的标签为'0'或'1'(垃圾邮件/非垃圾邮件)。所有这些数据集都已经是.tfrecord文件的形式。我试图改变......

回答 1 投票 0

gensim文档相似性:如何从最相似的结果中获取文档标题?

我正在使用gensim来分析大型语料库中的文档相似性。每个文档都有一个“标题”,或者更具体地说,一个唯一的ID字符串,以及内容文本。看了好几个......

回答 1 投票 0

我可以多次训练我的分类器吗?

我正在使用nltk和sklearn构建一个基本的NLP程序。我在数据库中有一个大型数据集,我想知道训练分类器的最佳方法是什么。是否可以下载...

回答 1 投票 1

如何在Wordnet中获取Synset偏移量以用于Imagenet

我计划使用Image-Net构建语言任务的同义词列表。根据Image-Net API文档,ImageNet基于WordNet 3.0。要唯一标识一个synset,我们使用“WordNet ID”...

回答 1 投票 5

“拼写检查”并在Python中返回更正的术语

我最近从pdf文件目录中提取了文本数据。阅读pdf时,有时返回的文本有点乱。例如,我可以看到一个字符串,上面写着:“他......

回答 2 投票 2

如何在nlp中解析时检索子树

我想在解析句子时检索子发辫,如下所示:sentence =“所有新药物必须经过测试才能开出处方”parser = stanford ....

回答 1 投票 1

Sci-Kit学习:将朴素贝叶斯模型预测纳入Logistic回归?

我有关于各种客户属性(自我描述和年龄)的数据,以及这些客户是否会购买特定产品的二进制结果{“would_buy”:“否”,“自我描述”:“我是......

回答 1 投票 2

如何从文本语料库中删除特定的单字组,但仍保留该单词的双字组?

我有这样的情况,我必须从文本语料库中删除特定单词unigram,同时保持该单词的双字符以及该单词的单词。我想传递一个文本地址......

回答 1 投票 0

如何使用Keras LSTM与word嵌入来预测单词id

在Keras中使用单词嵌入时,我在理解如何获得正确输出时遇到问题。我的设置如下:我的输入是批量形状(batch_size,sequence_length)。 ......中的每一行

回答 1 投票 1

经常性NN:参数共享的重点是什么?无论如何填充都不起作用?

刚刚开始研究RNN和LSTM ......我所看到的任何资源都没有回答过一个问题:以下是我如何理解RNN中参数共享的重点。我......

回答 1 投票 2

确定属于某一主题

我有来自Twitter帐户的一些文本数据。这些推文包含的数字是指在健身房的特定区域(通常是举重室和有氧运动区域)有多少人。我想 ...

回答 1 投票 2

关于LDA的建议

我正在尝试对一堆(约140个)文本文档进行文本分析。在预处理和删除不必要的单词和停用词之后,每个文档都有大约7000个句子(如...

回答 1 投票 0

运行时出现NLTK Python错误

我在anaconda中安装了nltk并尝试了本教程中的一些示例set pythonprogramming.net运行分类器保存示例后,它在anaconda上显示了一些错误...

回答 2 投票 0

使用TSNE嵌入可视化的单词不清楚

我已经从M. Baroni等人的Word Embeddings中下载了预先训练的单词嵌入模型。我想要想象句子中存在的单词的嵌入。我有两句话:sentence1 =“四......

回答 1 投票 2

使用自然语言处理从推文中提取地址

我正在构建一个Twitter机器人,会听取下面的推文:嘿@twitterbot,我正在寻找纽约123大街附近的餐馆,或者另一个例子:@twitterbot,什么是......

回答 2 投票 4

如何从python中的文本文件中获取所有3克?

我从文本文件中获取了一行,结果它生成了3克的一行,但在行尾,它的输出是2克。例如输入行是cswisceduwwt输出是csw swi wis isc sce ...

回答 1 投票 0

如何使用聚类对具有相似意图的句子进行分组?

我正在尝试用Python开发一个程序,它可以处理具有类似意图的原始聊天数据和集群句子,因此它们可以用作构建新聊天机器人的训练示例。目标是......

回答 1 投票 0

在pandas数据框中搜索文本列而不进行循环

我有一个pandas数据框,其中一列是文本描述字符串。我需要创建一个新列,以确定列表中的一个字符串是否在文本描述中。 df = ......

回答 2 投票 1

Spacy NER将实体拆分为两个独立的实体

我在下面的文字打印上做了NER([(i.text,i.label_)for i in doc.ents])我的文字看起来像ZS L-1 Cocoa&Burgers Ltd - 2013至2017我得到的输出( 'ZS L-1','ORG'),('...

回答 1 投票 0

在IBM Watson Conversation中标识没有任何实体的输入文本

有没有办法让Watson识别出没有实体的input.text?我不需要知道任何关于input.text的内容,我只需要知道它是否有实体。

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.