我需要知道如何使用 Oxygen XML 编辑器查找/替换文件来识别不包含字符串的文件

问题描述 投票:0回答:1

我正在处理数千个 METS 文件,并且需要能够识别不包含特定字符串的文件,例如模组:类型。我不是在文件名中搜索,而是在缺少特定内容的文件中搜索。

我尝试搜索 JAVA 正则表达式语法,因为这显然是 Oxygen 使用的正则表达式风格。我能找到的只是完整的 JAVA 代码集。我对正则表达式还很陌生,希望这些板上的人已经知道如何做我需要做的事情。

以下是示例元数据文件:https://uflorida-my.sharepoint.com/:u:/g/personal/gwswicord_ufl_edu/EeHF7UHXSX1NqbkbIrB8FWMBKIC_UTWPnV5fwPbZBXhSNg?e=xt5q0n。它是超过 39,000 个文件集的一部分。它不包含标签theses。我需要识别该集中也缺少该标签的所有文件。

在 Oxygen 在文件中查找/替换对话框中,在选中正则表达式复选框的要查找的文本框中,我尝试过: (?s)\A((?!theses ).)+\z

它没有返回任何结果。

问候, 毛重

regex oxygenxml
1个回答
0
投票

如果您正在 oXygen 中查看 XML 文件,我不确定您为什么要在查找中使用正则表达式。

您应该使用“XPath in Files...”(它只是打开设置范围的 XPath/XQuery Builder)。

尝试这个 XPath...

/*[not(.//*:genre[@authority='aat'][.='theses'])]
© www.soinside.com 2019 - 2024. All rights reserved.