Wikipedia多语言解析器

问题描述 投票:0回答:1

我在JavaScript中为jQuery Terminal使用简单的Wikipedia解析器(不是创建AST的实际解析器,只是创建了不同语法的一堆替换(404 error page中的Wikipedia命令。]

该代码使用API​​从Wikipedia获取文章,并在终端中显示文章。我的问题是我不知道如何解析其他语言。该解析器是为英语创建的,但是我刚刚添加了-l选项,并且其工作原理相同。除非由于语言而导致输出问题,例如在英语Wikipedia上为Category,在波兰语为Kategoria。您是否知道找出任何一种语言的元名称的任何方法?其他关键字为FilePlik。并且有很多语言,为其他Wiki创建关键字列表是否是找出这些名称的唯一方法?

[有帮助文章Help:Category,但波兰语翻译不是Kategoria,而是Kategorie(复数),所以我不能仅使用帮助页面来找出翻译。也有不同的模板(我不确定该怎么做)。为每种语言编写不同的解析器是正确解析Wikipedia文章的唯一方法吗?

javascript parsing wikipedia
1个回答
0
投票
[通常,大多数关键字翻译都可以在MediaWiki核心的MessagesPl.php中找到,并且可以使用各种别名文件进行扩展(例如,对于Gadgets扩展可以使用MessagesPl.phpGadgets.namespaces.php),但是鉴于使用的扩展数量很多,因此可能没有太大帮助。
© www.soinside.com 2019 - 2024. All rights reserved.