如何在时间范围内获得所有维基百科帐户?

问题描述 投票:0回答:1

我正在尝试复制 this 论文,其中他们使用 2010 年 9 月 9 日至 2011 年 2 月 14 日之间制作的用户帐户的随机样本。我如何使用维基百科 API 来获取此数据?

我似乎不知道如何使用他们的 API 的 usercontribs 来做到这一点(或其他任何事情)

web-scraping wikipedia wikipedia-api
1个回答
0
投票

list=usercontribs
提供用户贡献。你需要的是
list=logevents

对应的动作是

newusers/create
,表示“匿名用户创建”(不是
newusers/create2
,意思是“注册用户创建”)。

由于您似乎只需要用户名,因此

leprop
应设置为
user
lestart
leend
是您指定时间戳的位置;请注意,当
ledir
older
(默认值)时,第一个必须晚于第二个,反之亦然。

https://en.wikipedia.org/w/api.php
?action=query
&format=json
&formatversion=2

&list=logevents
&leprop=user
&leaction=newusers%2Fcreate
&lestart=2011-02-14T23%3A59%3A59.000Z
&leend=2010-09-09T00%3A00%3A00.000Z

尝试一下 使用 API 沙箱

每个响应都会有一个

lecontinue
令牌,您可以在下一个请求中使用它。

© www.soinside.com 2019 - 2024. All rights reserved.