前段时间我成功制作了一个数据库,其中包含特定国家/地区销售的汽车数量。我从中提取数据的网站已更改,多个国家/地区的数据现在混合在同一页面上。示例:
使用 xPath //tr[td='2020']/td[2] 选择 2 个值(欧洲和中国) https://www.goodcarbadcar.net/skoda-octavia-sales-figure/ 和 https://www.goodcarbadcar.net/skoda-superb-sales-figure/
以及 5 个值(美国、加拿大、欧洲、中国) https://www.goodcarbadcar.net/bmw-3-series-sales-figures/
有没有办法分别提取每个国家的销售数据?请注意,上表的标题不一致,宝马 3 系和斯柯达明锐是“欧洲年度销量”,而斯柯达速派是“年度”。
如果我理解正确的话,如果您知道有多少个值,则可以选择一个特定值。例如,要选择第二个值(在您链接的任一页面中),您可以使用:
(//div[contains(@class,"dataTables_wrapper")])[2]//td[.="2020"]/following-sibling::td
这将为您提供2020年中国年度销售额。
您可以使用
算出有多少个值count(//div[contains(@class,"dataTables_wrapper")])