x从特定表中提取值的路径?

问题描述 投票:0回答:1

前段时间我成功制作了一个数据库,其中包含特定国家/地区销售的汽车数量。我从中提取数据的网站已更改,多个国家/地区的数据现在混合在同一页面上。示例:

使用 xPath //tr[td='2020']/td[2] 选择 2 个值(欧洲和中国) https://www.goodcarbadcar.net/skoda-octavia-sales-figure/https://www.goodcarbadcar.net/skoda-superb-sales-figure/

以及 5 个值(美国、加拿大、欧洲、中国) https://www.goodcarbadcar.net/bmw-3-series-sales-figures/

有没有办法分别提取每个国家的销售数据?请注意,上表的标题不一致,宝马 3 系和斯柯达明锐是“欧洲年度销量”,而斯柯达速派是“年度”。

web-scraping xpath extract
1个回答
0
投票

如果我理解正确的话,如果您知道有多少个值,则可以选择一个特定值。例如,要选择第二个值(在您链接的任一页面中),您可以使用:

(//div[contains(@class,"dataTables_wrapper")])[2]//td[.="2020"]/following-sibling::td

这将为您提供2020年中国年度销售额。

您可以使用

算出有多少个值
count(//div[contains(@class,"dataTables_wrapper")])
© www.soinside.com 2019 - 2024. All rights reserved.