我试图找到从给定文本中提取类似关键字的最佳方法或算法。
我搜索了很多,发现了RAKE / MAUI和其他NLP算法,但它们并没有完全符合我的要求。我不想输入文本并提取关键字,但我想输入文本+主关键字,并以某种方式提取与主关键字相关的关键字。也许Damerau-Levenshtein算法会更好?
你能指点我这样做的PHP脚本/算法吗?例如,假设我们有文字说:“来自纽约的最好的管道工很昂贵。在纽约和一个管道工一起工作有时会很困难,但最终它会完成工作。一个便宜的管道工会做事情更难,因为通常他不会很专业。紧急管道可以24/7“
1)我想输入关键字:管道工纽约
2)和上面的文字,以及返回这些关键字的脚本:来自纽约的最佳管道工
在纽约的水管工
紧急管道
便宜的水管工
我怎样才能做到这一点?
您需要使用可以看到关系的方法,RAKE,MAUI等不会为您执行此操作。您可以使用它们作为获取文本相关关键字的第一步。我建议像页面排名一样查看基于图形的提取。