使用SGML / XML作为输入并使用文本作为输出来开发/现有程序-结构化技术英语(STE)

问题描述 投票:0回答:1

寻求咨询意见以重新开发/使用.XML和.SGML文件作为输入,并使用文本作为输出的现有程序(例如,将文本输入文本文件/ excel文件)。

还寻求可能的软件和工具,用于对内容进行检查,包括结构化技术英语(STE)。 http://www.asd-ste100.org/

删除标签前后,需要对内容进行多次不同的检查。例如;

  • 句子中的词数
  • 字符串匹配
  • 例外
  • 名词检查
  • 动词
  • 使用被动语态
  • 缺少文章

相关信息:

标签和内容通常散布在.SGML文件中的多行中(对于.XML文件可以假定相同)。>>

我们目前将VBA用于Excel,但是觉得这可能不适合该任务。

通过搜索发现,但不确定是否满足上述要求:

SGML解析器和引擎;http://cardscorporate.com/sgml/comer/sdk.htm

https://web.archive.org/web/20161217090033/http://en.allexperts.com/q/XML-1469/Manipulating-XML-files-Excel.htm

https://bettersolutions.com/vba/xml/microsoft-xml.htm

https://www.swi-prolog.org/

知道MSXML v2、4和6,但没有使用它们的经验

寻求咨询意见以重新开发/使用.XML和.SGML文件作为输入,并使用文本作为输出的现有程序(例如,将文本输入文本文件/ excel文件)。也正在寻找可能的软件&...

xml vba dom markup sgml
1个回答
0
投票

Microsoft Office的当前版本(包括Excel)为Microsoft XML格式。如果您是从XML或其祖先SGML开始的,我建议您不要通过将数据转换为文本而丢失在SGML或XML元素类型中找到的信息,而应使用XSLT或XQuery将数据转换为Microsoft Office XML格式。然后,您将需要寻找特殊的语言工具来进行检查和更正。

© www.soinside.com 2019 - 2024. All rights reserved.