我有一个数据集,我想在该数据集上使用NLP进行短语提取,但我无法这样做?

问题描述 投票:0回答:1

如何使用具有一组句子和相应标签的数据集从句子中提取短语,>]

Sentence1:I want to play cricket 
Label1: play cricket

Sentence2: Need to wash my clothes
Label2: wash clothes

我已经尝试过将块与nltk一起使用,但是我无法将训练数据与块一起使用。

[如何使用具有句子Sentence1形式的一组句子和相应标签的数据集从句子中提取短语:我想玩板球Label1:播放板球Sentence2 ......

machine-learning nlp artificial-intelligence nltk word2vec
1个回答
0
投票
您描述的“提示短语”在明确的软件支持下不能准确地映射到其他类型的“短语”。

例如,gensim Phrases模块使用纯粹的统计方法来发现相对于每个单词的基本速率而言如此常见的相邻单词对,以至于可以将它们有效地视为一个组合单元。它可能会将某些实体变成短语(例如:“ New York”(纽约)->“ New_York”)或重复的习语(例如:“ slacking off”->“ slacking_off”)。但这只是相邻的单词,而不是您要查找的上下文释义。

© www.soinside.com 2019 - 2024. All rights reserved.