wikipedia 相关问题

考虑标签wikipedia-api(或更一般的mediawiki-api)和mediawiki。问题应与编程有关。

是否有一个干净的维基百科API仅用于检索内容摘要?

我只需要检索维基百科页面的第一段。内容必须是html格式化,随时可以在我的网站上显示(所以没有BBCODE或WIKIPEDIA特殊代码!)

回答 12 投票 133

将Wikipedia表格抓取到熊猫数据框

我需要将Wikipedia表刮到熊猫数据框并创建三列:PostalCode,Borough和Neighbours。 https://en.wikipedia.org/wiki/List_of_postal_codes_of_Canada:_M这是...

回答 5 投票 0

使用API 从维基百科中读取数据[关闭]

对于我的项目,我试图从维基百科读取数据,我不完全确定,我该怎么做。我主要关注的是活动的阅读,日期,地点和主题。首先,我已经开始......

回答 1 投票 1

为什么traceroute在最后一跳时期望“Destination Unreachable”而不是在UDP上运行时“Echo Reply”?

traceroute的维基百科页面的实现部分摘录:“...到达目的地之前,如果正在使用UDP数据包,则返回ICMP目的地无法到达消息或...

回答 1 投票 0

使用数据导入处理程序将数据上载到Solr

嗨,我正在努力用数据导入处理程序将我的数据上传到solr。我正在做的是使用服务器文件夹中的命令启动一个solr服务器solr start然后允许我打开...

回答 2 投票 0

来自file_get_contents的变量响应'https://en.wikipedia.org/wiki/Category:Upcoming_singles'

的file_get_contents( 'http://en.wikipedia.org/wiki/Category:Upcoming_singles');返回不同的结果(2个产品),而使用Chrome访问同一地址返回4个产品。在......

回答 4 投票 4

如何获取所有维基百科文章的标题列表

我想获得所有维基百科文章的所有标题列表。我知道有两种方法可以从维基媒体的维基上获取内容。一个是API,另一个是......

回答 2 投票 21

使用python逐步解析大型wikipedia转储XML文件

目标是从维基百科DUMP(70Gb文件)中读取所有...内容。这是不可能加载到内存中的,因此我尝试逐步解析文件并从中获取一些值。然而 ...

回答 2 投票 0

从维基百科表中抓取数据

我只是想把维基百科表中的数据写入熊猫数据帧。我需要重现三列:“邮政编码,自治市镇,社区”。导入请求website_url = requests.get('...

回答 3 投票 0

将维基百科表保存为图像[关闭]

是否可以从维基百科中检索表格作为图像?这里的例子,在iPhone的维基百科页面中,“模型比较”部分有一个大表。

回答 2 投票 1

维基百科刮刮 - 需要帮助来构建它

我正试图抓住这个维基百科页面。我遇到了一些问题并感谢您的帮助:有些行有多个名称或链接,我希望将它们全部分配给...

回答 1 投票 3

从页面获取(法语)维基百科的总页面视图

我正在搜索法语维基百科项目的任何页面的总页面浏览量(从2015年7月,PageViews API的发布日期,到2019年1月1日)。使用PageViews API(如何使用Wikipedia API ...

回答 2 投票 0

wikidata查询错过了欧洲国家

我对wikidata使用以下查询; SELECT?country?countryLabel WHERE {?country wdt:P30 wd:Q46; wdt:P31 wd:Q6256。服务wikibase:...

回答 1 投票 1

将Wikipedia Dump加载到Elasticsearch中

我想将一个XML Wikipedia转储加载到Elasticsearch(例如:http://ftp.acc.umu.se/mirror/wikimedia.org/dumps/enwiki/20171001/enwiki-20171001-pages-articles.xml.bz2)。 4)。但是,所有工具和......

回答 2 投票 1

如何检查维基百科上是否存在某个人?

所以我需要一个功能。一个示例输入将是“donald trump”(我不希望它区分大小写)如果Wikipedia上存在关于此人的文章,则函数返回摘要和图片。 ...

回答 1 投票 0

在python中获取维基百科文章的类别

我使用下面提到的代码来检查维基百科页面的存在。 term =“forensics”a = urllib.request.urlopen(“https://en.wikipedia.org/wiki/”+ term).getcode()print(a)如果页面...

回答 2 投票 1

如何只使用BeautifulSoup获取维基百科页面上所有表格第一行的数据?

我正试图从这个维基百科页面抓取数据。以下是我目前使用的代码。代码:from bs4 import BeautifulSoup import urllib.request def make_soup(url):thepage = ...

回答 1 投票 0

QGis:如何将svg或光栅图像导入Quantum GIS?

这些矢量或光栅文件是没有地理坐标的经典文件。它们是拉/长投影,我想将它们导入到QGIS中,向上/向下缩放它们,将它们放在正确的位置,它们......

回答 2 投票 6

如何在维基百科文章中显示维基数据附加链接

我有一个本地版本的维基百科和维基数据运行。我想在侧边栏中的文章和wikidata对象之间建立关联,就像在标准安装中一样。但在我...

回答 1 投票 3

有选择地使用Python刮取维基百科表

我在排序维基表时遇到了麻烦,并希望以前做过它的人可以给我建议。从List_of_current_heads_of_state_and_government我需要国家(使用下面的代码)和......

回答 3 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.