wikipedia 相关问题

考虑标签wikipedia-api(或更一般的mediawiki-api)和mediawiki。问题应与编程有关。

正则表达式捕获太多

我需要为维基百科上的 AutoWikiBrowser 机器人创建 .NET 正则表达式,但遇到问题。 该示例相当长,但我需要更长的正则表达式来查找最多 14 种语言指示

回答 1 投票 0

用于删除特定维基百科模板中重复值的正则表达式

我正在尝试使用 AutoWikiBrowser 机器人(适用于 .NET 风格)通过正则表达式删除 Wikipedia 模板中的重复值(并且仅在这个模板中)。 我想找到 {{mul|fr|en|fr}} ...

回答 1 投票 0

如何使用Python抓取类别维基百科页面类别中的子类别和页面

所以我试图抓取类别页面的类别标题下的所有子类别和页面:“类别:基于类的编程语言”,位于: https://en.wikipedia.org/wiki/Categ...

回答 2 投票 0

如何下载和使用维基百科数据转储?

我想计算特定语言(例如英语)的 wiki 转储中的实体/类别。对于初学者来说,官方文档很难找到/遵循。到目前为止我所理解的是...

回答 3 投票 0

转换/转置表格列 -> 行的模板

我有一个包含许多列的表格,我可以转换该表格以表示相同的信息,但将列标题放置在行中。尝试转换此表的示例: {|类=“维基表” !是...

回答 2 投票 0

如何处理维基百科 Python API 中页面缺失的坐标

我尝试显示页面坐标。然而,有些页面没有坐标,API 的行为就很奇怪。 为了: 从维基百科导入维基百科,消歧错误 尝试: 页面=维基百科。

回答 1 投票 0

如果条件为真,如何重复代码

我有这个代码: 从输入导入文本 导入tweepy 随机导入 from tweepy import 响应,推文 客户端 = tweepy.Client( Consumer_key =“XXXXXX”, Consumer_secret =“XXXXXX&

回答 1 投票 0

Wikipedia API:如何获取页面的修订次数?

有人知道如何使用 mediawiki API 获取维基百科页面的修订数量吗? 我已经阅读了这个API文档,但找不到相关的API: 修改API

回答 5 投票 0

如何处理维基百科Python API中页面缺失的坐标

我尝试显示页面坐标,但是有些页面没有坐标,API 的行为很有趣。 为了: 从维基百科导入维基百科,消歧错误 尝试: 页面=维基百科...

回答 1 投票 0

所有维基百科文章的标题,无需重定向

我正在尝试获取所有维基百科标题的列表,而无需重定向。 他们说他们有大约 6,410k 篇文章。我试图通过 https://dumps.wikimedia.org/enwiki/latest/ 和文件来获取列表

回答 2 投票 0

维基百科信息框内容

我需要获取任何电影的信息框的内容。我知道电影的名字。一种方法是获取维基百科页面的完整内容,然后对其进行解析,直到找到 {{Infobox and then get ...

回答 5 投票 0

如何从维基百科信息框中提取信息?

中有这个精美的信息框。我如何获得 的值?

回答 3 投票 0

正则表达式捕获的内容超出了想要的范围

我想使用 AutoWikiBrowser(一个处理正则表达式的自动编辑器)删除维基百科上的引用,但我面临着标签的新手问题。 例如,我想删除所有引用

回答 1 投票 0

如何减少 Okawix 维基百科转储的大小?

Okawix 有一个适用于 Android 的应用程序。我有一个 12 GB 纯文本维基百科转储,但它太大,无法放入 SD 卡。 有没有办法从这个 Okawix 转储中创建一个新的转储,仅选择计算机或 IT-

回答 1 投票 0

从维基百科页面的边表收集数据

我正在尝试创建一个Python脚本,它可以从维基百科页面的边表中收集信息。有关示例,请参阅此页面。沿着页面的右侧,有 3 个垂直的

回答 1 投票 0

维基百科的C语言相互递归的例子

bool is_even(unsigned int n) { 如果(n==0) 返回真; 别的 返回 is_odd(n - 1); } bool is_odd(无符号整数n) { 如果(n==0) 返回假; 别的 重新...

回答 1 投票 0

获取某些信息框属性的自动值

我正在使用 pywikibot api 来获取维基百科信息框属性。我想提取的很少有人口密度、人口、海拔等。对于某些城市,例如(https://en.wikipedia.org/wiki/

回答 2 投票 0

维基百科 API 在关键字搜索后给出错误页面

所以我为我的不和谐机器人创建了一个命令来基于字符串研究维基百科页面: 导入请求 导入 json 导入不和谐 从日期时间导入日期时间、时区 def getWiki(搜索):

回答 1 投票 0

维基百科是否使用不同的方法来计算图像路径的哈希部分?

我正在使用dbpedia的extraction_framework(ImageExtractor#getImageUrl)来 获取图片的url(前两个字符的md5) val md = MessageDigest.getInstance("MD5") val 消息摘要 = md.

回答 3 投票 0

我如何准备使用整个维基百科进行自然语言处理?

我是新来的。我有一个项目,我必须下载并使用维基百科进行 NLP。我面临的问题如下: 我的 RAM 只有 12 GB,但英文 wiki 转储超过 15 GB

回答 3 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.