从 RTF 中解析格式化文本

问题描述 投票:0回答:3

我正在尝试从 RTF 文件中解析粗体文本行。现在,我通过使用 Regex 并在文件中查找“... 0”标签来完成此操作,但这会留下大量格式文本,并且 RTF 中有如此多的格式标签,我不能只是将其全部硬编码出来然后就到此为止。是否有更优雅的现有解决方案用于仅解析具有特定格式的行?

c# .net rtf
3个回答
0
投票

我会使用 RTF 解析器...我想到了

RichTextBox
。使用 RTB 获取格式有多种方法。


0
投票

不。我最近处理了一个项目,在该项目中,我们必须获取包含嵌入式媒体的 RTF 文档,并将其转换为 MIME 多部分消息。我们构建了几组正则表达式来分解文档的各个部分,然后将每个格式选项转换为适当的 HTML/CSS 标记。确实没有一种“优雅”的方式来做你想做的事。

您想用 RTF 做什么?我们的最终目标是对所提供的 RTF 进行 HTML 转换。我知道 WPF 世界中的 RichTextBox 能够保存为多种格式,例如 XAML,这可能会消除您自己处理解析的需要。

此外,市场上也有 RTF 转换器,因此通过更多背景信息,我可以提出更好的建议。


-1
投票

你应该看看RtfDomParser。 我发现在某些情况下解析器无法工作,但总体来说是可以的。

© www.soinside.com 2019 - 2024. All rights reserved.