使用 Python 从 ESPNCricInfo StatsGuru 中抓取 .csv 数据

问题描述 投票:0回答:2

请您建议如何从以下网址进行抓取:

https://stats.espncricinfo.com/ci/engine/stats/index.html?class=1;filter=advanced;orderby=innings;size=200;spanmax1=07+Aug+2020;spanmin1=07+ 2015 年 8 月;spanval1=span;模板=结果;类型=击球

...这样结果就可以放在这样的表格中:

我遇到的问题是多个 HTML 标签具有相同的类“engineTable”。

谢谢!

python html csv web-scraping
2个回答
2
投票

尝试一下:

import pandas as pd

df = pd.read_html("https://stats.espncricinfo.com/ci/engine/stats/index.html?class=1;filter=advanced;orderby=innings;size=200;spanmax1=07+Aug+2020;spanmin1=07+Aug+2015;spanval1=span;template=results;type=batting")[2]

0
投票

您能否分享最新的代码,因为 pd.read_html 未在新的 python 版本中运行?

出现错误:- pd.read_html 将被废弃

© www.soinside.com 2019 - 2024. All rights reserved.