使用Openxml读取word文档中的文本和格式

问题描述 投票:1回答:1

我一直试图解决这个问题,但似乎我真的需要帮助。

我正在使用OpenXml阅读Word文档。

我需要word文档及其格式中的文本。

我有这个代码来获取文本和属性

WordprocessingDocument wordprocessingDocument = WordprocessingDocument.Open(stream, true);

            Body body = wordprocessingDocument.MainDocumentPart.Document.Body;
            foreach (var item in body)
            {
                //Console.WriteLine(">>text: " + item.InnerText);
                foreach (var tt in item.GetAttributes())
                {
                    Console.WriteLine(tt.LocalName + " : " + tt.Value);
                }

            }

上面代码的输出类似于此

rsidR : 0067182C
rsidP : 002A2C9A
rsidRDefault : 004052D2
rsidR : 0067182C
rsidRDefault : 004052D2
rsidR : 0067182C
rsidSect : 0067182C

我需要的是word文档中每个文本中使用的格式。但这些意味着什么呢?

这是我的示例Word文档的屏幕截图。我可以像Bold一样检索它。字体名称。字体大小?

enter image description here

问候,鲍勃

c# openxml docx
1个回答
0
投票

您可以使用Descendants节点并在其上创建循环,然后您可以获得您正在寻找的东西。

如果你仍然无法做到,请告诉我。

谢谢

© www.soinside.com 2019 - 2024. All rights reserved.