我有一组276个不同的单词,我想从中生成所有可能的正确句子。它只能由两个或多个单词组成。
我用NLTK标记器给每个单词一个类。例如('And','CC'),('now','RB'),('for','IN'),('something','NN'),但是当单词彼此独立(在我的情况下为276个单词的数组)。
[如果有人对我的想法有所了解,那将对我有很大帮助。谢谢!
S -> NP VP
NP -> det adj* noun
VP -> verb NP
VP -> verb NP conj NP
依此类推。这是一个相当古老和简单的机制,但应该足够容易实现。您只需生成规则的扩展,直到达到单词类类别,然后用相应的单词替换它们即可。当然,这是一个不同的问题,因为您的句子在语法上是正确的,但在语义上却很奇怪。