我应该如何构造查询以从https://en.wikipedia.org/wiki/Michael_Bisping的混合武术记录部分的(第一个)表中获取数据?理想情况下,我希望将表数据获取为json,但HTML也可以使用。
我已经尝试过此查询来获取页面的各个部分:https://en.wikipedia.org/w/api.php?action=parse&prop=sections&page=Michael_Bisping
结果告诉我该表在索引为12的部分中。我不知道接下来要运行什么查询。
在此处使用API Sandbox生成URL!
将action
设置为parse
。
[Page
至Michael Bisping
[Section
至12
(混合武术记录)
最终网址:
https://en.wikipedia.org/wiki/Special:ApiSandbox#action=parse&format=json&page=Michael%20Bisping&prop=text§ion=12&callback=
prop=extracts
和action=query
来获得解析结果:https://en.wikipedia.org/w/api.php?action=query&format=json&titles=Michael%20Bisping&prop=extracts
但是,section=12
无法实现此请求(?),也许还有另一种解析结果的方法
我设法通过此查询获取整个部分:https://en.wikipedia.org/w/api.php?action=parse&format=json&page=Michael_Bisping§ion=12
我通过查询特定部分的索引(在这种情况下为12)来定位特定部分。