在Java中解析XML文件的困惑

问题描述 投票:1回答:1

鉴于此XML文件:

<?xml version="1.0" encoding="UTF-8"?>
<root>
   <data>
      <track clipid="1">
         <url>http://www.emp3world.com/to_download.php?id=33254</url>
         <http_method>GET or POST</http_method>
         <post_body>a=1&b=2&c=3</post_body>
      </track>
   </data>
</root>

我所追求的是从这个XML文件打印这样的东西:

ID: 1
URL: http://www.emp3world.com/to_download.php?id=33254
Http method: GET or POST

目前这是我的原始处理程序代码:

class MyHandler extends DefaultHandler
{
    String str = "";
    StringBuilder s = new StringBuilder();
    public void startElement(String namespaceURI, String sName, String qName, Attributes atts)
    {
        if(qName.equals("track"))
        {
            s.append("ID: ").append(atts.getValue("clipid")).append("\n");
        }
        if(qName.equals("url"))
        {
            s.append("URL: ");
        }
        if(qName.equals("http_method"))
        {
            s.append("Http method: ");
        }
    }

    public void endElement(String uri, String localName, String qName)
    {
        if(qName.equals("url"))
        {
            s.append(str).append("\n");
            str = "";
        }
        if(qName.equals("http_method"))
        {
            s.append(str).append("\n");
            str = "";
        }
        System.out.println(s);
    }

    public void characters(char[] ch, int start, int length) throws SAXException {
        str = new String(ch, start, length);
    }
}

我的问题是它总是打印结果4次(没有Http Method字段的第一次。我想这对所有Sax Parsers初学者来说都是一个问题。 我知道startElement,endElement,characters函数是做什么的,但正如你所看到的,我不知道如何正确使用它们。我应该在代码中更改什么才能获得正确的输出?

java saxparser
1个回答
4
投票

问题是你的角色方法。改变它的身体

s.append(new String(ch, start, length));

然后将此行添加到startElement的开头

s.setLength(0);

你应该看到一些输出。

以下是the Java tutorial on SAX关于字符方法的说法:

解析器不需要一次返回任何特定数量的字符。解析器可以一次从单个字符返回任何内容,但仍然是符合标准的实现。因此,如果您的应用程序需要处理它看到的字符,那么使用characters()方法在java.lang.StringBuffer中累积字符并在您确定已找到所有字符时对它们进行操作是明智的。

© www.soinside.com 2019 - 2024. All rights reserved.