我正在尝试使用wikipeida的官方API从wikipeida获取包含所有图像的html内容。目前,我使用的 api 仅返回 html 内容
这就是我正在使用的
https://en.wikipedia.org/w/api.php?action=query&prop=extracts&titles=google&format=json&origin=*
提前谢谢🙏
您可以使用以下查询示例获取文本和图像
https://en.wikipedia.org/w/api.php?action=parse&prop=text|images&page=google&format=json&origin=*
然后对于每张图片,你都可以获得url,可以用来下载图片。例如
https://en.wikipedia.org/wiki/Special:ApiSandbox#action=query&format=json&prop=imageinfo&titles=File%3ASemi-protection-shackle.svg&iiprop=url
获取页面上所有图像的 url 的另一个示例
https://en.wikipedia.org/wiki/Special:ApiSandbox#action=query&format=json&prop=imageinfo&rawcontinue=1&titles=google&generator=images&iiprop=url