Wikipedia转储文件上的功能

问题描述 投票:1回答:1

我们可以使用functions中的Wikipedia APIWikipedia中得到一些结果。

例如:

**import Wikipedia

print(Wikipedia.search("Bill", results=2)).**

我的问题,如何为特定版本的Wikipedia(例如,仅Wikipedia 2017)使用Wikipedia API函数?!

wikipedia-api pywikibot
1个回答
2
投票

我怀疑这是可能的。 PyWikibot使用MediaWiki的在线API(在本例中为站点Wikipedia)。这始终是实时数据。

您提到的转储是Wikipedia数据的脱机快照(假设您正在谈论https://dumps.wikimedia.org/)。此数据未以任何方式连接到MediaWiki API,因此无法对其进行查询。

[在特定时间可以浏览维基百科的数据:

  • 如果仅是有限数量的页面:您可以编写一个脚本,以遍历页面的可用修订并选择与所需时间最接近的一个。这可能容易出错,需要大量工作并且无法真正扩展]
  • 下载要查询的转储,并编写可以在文件上使用的脚本(例如,取决于您要执行的操作,数据库转储或静态html转储,您的问题尚不清楚)
© www.soinside.com 2019 - 2024. All rights reserved.