从Mediawiki到GFM的Pandoc转换

问题描述 投票:2回答:1

在尝试使用Pandoc将MediaWiki文件转换为GitHub Flavored Markdown时遇到问题,我们有一些模板如下所示:

{|cellspacing="0" cellpadding = "10" style="border-style:solid; border-color:black; border-width:1px;" width="100%"
| Some text....
|}

该脚本失败并显示错误:

Error at "source" (line 156, column 19):
unexpected "c"
expecting lf new-line, "!", "<" or "|"
{|cellspacing="0" cellpadding = "10" style="border-style:solid; border-color:black; border-width:1px;" width="100%"
                  ^
  • 工具Pandoc 2.0.1.1
  • 输入从MediaWiki 1.21.2导出的xml文件
  • 输出Markdown文件
pandoc --from=mediawiki --to=gfm C:\Users\xxx\AppData\Local\Temp/pandoc5c93ace7d42b7

有任何建议,谢谢你的支持。

mediawiki pandoc github-flavored-markdown
1个回答
1
投票

Pandoc无法读取导出的XML,只能读取实际的MediaWiki标记。标记作为XML的一部分导出,但如果想要将其提供给pandoc,则必须通过XML处理器提取。

寻找元素/mediawiki/page[ns=0]/revision/text(XPath)。

© www.soinside.com 2019 - 2024. All rights reserved.