我尝试在 Wikidata 上运行 SPARQL 查询,但超时。我想下载一个 dump 并将其索引到某个数据库中,这样我就可以使用 HTTP 请求运行本地 SPARQL 查询。我还需要支持 Wikidata 特定的扩展,例如
SERVICE wikibase:label
。我已经下载了 RDF 转储。下一步是什么?
Wikimedia 有文档,介绍如何从其转储之一运行您自己的 SPARQL 端点。他们还有一个更新程序,可以从其服务器传输更新,以使您的端点保持最新状态。
您不需要做任何特殊的事情来支持他们的扩展,它是默认包含的。
我建议在生产中使用带有 http 身份验证的反向代理(如 nginx 或 apache),默认情况下可以访问管理仪表板。
您可以尝试使用qEndpoint。有两种选择:
https://hub.docker.com/r/qacompany/qendpoint-wikidata
这将基本上安装 qEndpoint 并下载整个 wiki 数据的索引。如果互联网连接良好,您应该会在 3 小时内获得它。
https://github.com/the-qa-company/qEndpoint/wiki/Use-qEndpoint-to-index-a-dataset#start-the-endpoint
PS:支持 SPARQL 1.1 以及
SERVICE wikibase:label
子句。