如何将地名列表与 python 中的语料库匹配?

问题描述 投票:0回答:0

我有一个包含地名列表的文件,我想将其与研究摘要语料库中的研究地点进行匹配。地名列表存储在如下文件中

地名 特点 经度 纬度
布法罗河 人烟稀少的地方 -115.0388091 60.8808899
阿卡斯塔湖 水景 -115.5514499 65.3669450
艾伯特湾 水景 -122.1522977 69.8003026
奥斯汀湖 水景 -110.1675149 62.1836381

理想情况下,我希望帮助编写一个 python 代码,该代码返回所有匹配的地名(尤其是包含超过 2 个单词的地名,例如“Buffalo River”)以及相应的特征、经度和纬度值。例如,假设列表中的一个地名(例如“Austin Lake”)与语料库中的一个地名匹配,那么希望代码不仅返回匹配的地名(在本例中为 Austin Lake),还返回它的地名相应的Feature(水景),Longitude(-110.1675149)以及Latitude(62.1836381)值。

我在这里遇到了一个相关问题:match names of a geographic dictionary from text in python。不幸的是,当我尝试答案中的解决方案时,他们无法识别我的语料库中包含多个单词的地名(如上表中的所有单词),并且也无法返回旁边的特征、经度和纬度列的值匹配的地名。谁能帮忙?

python nltk text-mining named-entity-recognition nsregularexpression
© www.soinside.com 2019 - 2024. All rights reserved.