为什么dom4j文档对象将XML EOL \ r \ n转换为\ n

问题描述 投票:0回答:1

我正在使用DOM4J jar解析xml字符串(我试过1.6.1和2.0.2)下面是我的示例代码

SAXReader reader = new SAXReader();
InputSource inputSource = new InputSource(new StringReader("<root xml:space='preserve'>\r\n<emp>\r\n<name>raj</name>\r\n</emp>\r\n</root>"));
Document document = null;

try {
    document = reader.read(inputSource);
} catch (DocumentException e1) {
    e1.printStackTrace();
}       
String st = document.asXML(); //When I debug I can see below value in this st variable
//<root xml:space='preserve'>\n<emp>\n<name>raj</name>\n</emp>\n</root>

为什么将XML EOL(End of Line)从\ r \ n转换为\ n?

如果我想保留与“\ r \ n”相同的EOL,有没有可用的选项?

java xml xml-parsing dom4j
1个回答
0
投票

specification授权:

为了简化应用程序的任务,XML处理器必须表现得好像它在解析之前对输入中的外部解析实体(包括文档实体)中的所有换行符进行规范化,方法是翻译两个字符的序列#xD #xA和任何# xD后面没有#xA到单个#xA字符。

您可以设置编写XML文档时使用的行分隔符:

OutputFormat#setLineSeparator(String)
© www.soinside.com 2019 - 2024. All rights reserved.