如何利用wiki API获取bigdata?

问题描述 投票:-1回答:1

对于名单中的每个人,我需要得到一个人的名字,出生日期,死亡日期,和图像URL。

我计划通过以下方式来使用 Category:Born_on_day_month 为一年中的每一天,通过维基百科(每一天有大约1000人)。

当我试图与 php-script 名单 Q2669358但当我试图通过Wiki获取每个人的Wiki ID时

然而,当我试图通过以下方式获得每个人的Wiki ID时 这个 然后由 这个在5-10个请求后,它就会抛出一个错误(一个请求大约需要0.5s)。

我知道这不是最好的方法,希望能找到更好的方法。最好的方法是什么?也许是一个大的请求,用于某个子目的)?

php wikipedia mediawiki-api
1个回答
0
投票

前两个请求可以组合成 https:/ru.wikipedia.orgwapi.php?action=query&format=xml&generator=categorymembers&gcmlimit=max&gcmtitle=Category:родившиеся_1_января&prop=pageprops。.

可以使用 "action=wbgetentities "来减少Wikidata的请求。然后,你可以添加最多50个用管子隔开的项目id,如 https:/www.wikidata.orgwapi.php?format=xml&action=wbgetentities&ids=Q4054186。

© www.soinside.com 2019 - 2024. All rights reserved.