删除不属于城市名称字典文本文件的关键字

问题描述 投票:0回答:1

我有一个字典文本文件,其中包含世界各城市的名称/关键字,这些关键字几乎都是3,00,000,但它也有许多不相关的关键字,例如: this , is , on ,Over , Old , It , a , From etc .....

您可以看到这些关键字不属于任何城市名称,那么如何删除所有不属于城市名称的关键字。

我不知道该怎么办。

有没有解决这个问题的解决方案?一些示例数据在这里

Japon
Bagpat
Jharda
Kilbrin
This
Großköllnbach
Sighetu Silvaniei
Schweich
Colinet
Leskovec
Trizay
Kilen
Le Perreux
Give
Combourg
Migliaro
Stawki
Kingham
python python-3.x dictionary text
1个回答
0
投票

你应该准备一个不相关的词语来检测它们,然后你可以删除这些不相关的词。

如果您不知道文件中哪些单词是非城市名称,则应尝试分析并找出这些不相关单词之间的相似之处。

© www.soinside.com 2019 - 2024. All rights reserved.