我正在尝试复制 this 论文,其中他们使用 2010 年 9 月 9 日至 2011 年 2 月 14 日之间制作的用户帐户的随机样本。我如何使用维基百科 API 来获取此数据?
我似乎不知道如何使用他们的 API 的 usercontribs 来做到这一点(或其他任何事情)
list=usercontribs
提供用户贡献。你需要的是list=logevents
。
对应的动作是
newusers/create
,表示“匿名用户创建”(不是newusers/create2
,意思是“注册用户创建”)。
由于您似乎只需要用户名,因此
leprop
应设置为 user
。 lestart
和 leend
是您指定时间戳的位置;请注意,当 ledir
为 older
(默认值)时,第一个必须晚于第二个,反之亦然。
https://en.wikipedia.org/w/api.php
?action=query
&format=json
&formatversion=2
&list=logevents
&leprop=user
&leaction=newusers%2Fcreate
&lestart=2011-02-14T23%3A59%3A59.000Z
&leend=2010-09-09T00%3A00%3A00.000Z
尝试一下 使用 API 沙箱。
每个响应都会有一个
lecontinue
令牌,您可以在下一个请求中使用它。