使用XML XPATHS的Wikipedia LATITUDE和LONGITUDE(在Python中)

问题描述 投票:-2回答:2

我正在尝试从(随机)维基百科条目中获取纬度和经度。

wiki_coordinates(website)
coordinates = website.xml.find('.//*[@id="coordinates"]/')

这里是HTML来自https://en.wikipedia.org/wiki/Seattle(纬度和经度)

HTML有两个“有趣的”部分

<span class="latitude">47°36′35″N</span> <span class="longitude">122°19′59″W</span>

<span class="geo-dec" title="...">47.60972°N 122.33306°W</span>

问题是每个维基百科条目都有不同的xpath(或缺少)。

例如:

XPath =  ".//*[@id="coordinates"]/span/span/a/span[1]/span"
XPath = ".//*[@id="coordinates"]/span/a/span[3]/span[1]"

谢谢!

python xpath xml-parsing geocoding
2个回答
1
投票
如果您想直接(从Wikipedia的顶部对LATITUDE和LONGITUDE进行索引,则有两种方法。

coordinates = website.xml.find('.//*[@class="geo-dec"]').text

latitude = website.xml.find('.//*[@class="latitude"]').text longitude = website.xml.find('.//*[@class="longitude"]').text

希望这会有所帮助! :)

0
投票
尝试使用此xpath表达式,看看它是否适用于这些页面:

//span[@id="coordinates"]//span[@class="geo-dec"]//text()

© www.soinside.com 2019 - 2024. All rights reserved.