我已经开始研究一个简单的XML拉解析器了,因为我已经开始思考XML中关于某些字符/序列的正确语法,可忽略的空格等等(谢谢你,http://www.w3schools.com/xml/xml_elements.asp),我意识到我仍然不知道蹲下了什么可以勾勒出来的情况如下(Validome发现格式非常好;请注意我只想使用xml文件进行数据存储,不需要实体,DTD或Schema):
<bookstore>
<book id="1">
<author>Kurt Vonnegut Jr.</author>
<title>Slapstick</title>
</book>
We drop a pie here.
<book id="2">Who cares anyway?
<author>Stephen King</author>
<title>The Green Mile</title>
</book>
And another one here.
<book id="3">
<author>Next one</author>
<title>This time with its own title</title>
</book>
</bookstore>
“我们在这里放一块馅饼。”和“另一个在这里。”是'bookstore'元素的值。 “无论如何,谁在乎呢?”是与第二个“book”元素相关的值。
这些如何处理,如果有的话?将“我们在这里放一块馅饼”。和“这里的另一个。”连接形成一个'bookstore'元素的值,或者它们是分开处理,存储在某个地方,影响它们所属元素的解析结果,还是......?
最简单的方法是使用一些符合标准的解析器解析它并转储输出。