如何使用具有一组句子和相应标签的数据集从句子中提取短语,>]
Sentence1:I want to play cricket Label1: play cricket Sentence2: Need to wash my clothes Label2: wash clothes
我已经尝试过将块与nltk一起使用,但是我无法将训练数据与块一起使用。
[如何使用具有句子Sentence1形式的一组句子和相应标签的数据集从句子中提取短语:我想玩板球Label1:播放板球Sentence2 ......
例如,gensim Phrases
模块使用纯粹的统计方法来发现相对于每个单词的基本速率而言如此常见的相邻单词对,以至于可以将它们有效地视为一个组合单元。它可能会将某些实体变成短语(例如:“ New York”(纽约)->“ New_York”)或重复的习语(例如:“ slacking off”->“ slacking_off”)。但这只是相邻的单词,而不是您要查找的上下文释义。