python解析xml,如何获取值?

问题描述 投票:0回答:1

我尝试在 Python 中解析 XML 数据并努力提取值。 数据看起来像这样:

[<generic:Obs>
<generic:ObsDimension value="2020-01-02"/>
<generic:ObsValue value="1.1193"/>
<generic:Attributes>
<generic:Value id="OBS_STATUS" value="A"/>
<generic:Value id="OBS_CONF" value="F"/>
</generic:Attributes>
</generic:Obs>, <generic:Obs>
<generic:ObsDimension value="2020-01-03"/>
<generic:ObsValue value="1.1147"/>
<generic:Attributes>
<generic:Value id="OBS_STATUS" value="A"/>
<generic:Value id="OBS_CONF" value="F"/>
</generic:Attributes>
</generic:Obs>]

我想用 ['Date','Value'] 列创建 Pandas DF。 日期应该是

<generic:ObsDimension value="2020-01-03"/>
外的值,
<generic:ObsValue value="1.1147"/>
外的值。 当我运行代码时:

soup = BeautifulSoup(response.text, 'xml')
dates = soup.find_all("ObsDimension")

我得到的结果是:

[<generic:ObsDimension value="2020-01-02"/>,
 <generic:ObsDimension value="2020-01-03"/>,
 <generic:ObsDimension value="2020-01-06"/>,
 <generic:ObsDimension value="2020-01-07"/>,
 <generic:ObsDimension value="2020-01-08"/>,
 <generic:ObsDimension value="2020-01-09"/>]

但是我怎样才能得到它的日期和相应的值呢?

python-3.x xml beautifulsoup xml-parsing
1个回答
0
投票

尝试:

import pandas as pd
from bs4 import BeautifulSoup

xml_doc = '''\
<data>
<generic:Obs>
<generic:ObsDimension value="2020-01-02"/>
<generic:ObsValue value="1.1193"/>
<generic:Attributes>
<generic:Value id="OBS_STATUS" value="A"/>
<generic:Value id="OBS_CONF" value="F"/>
</generic:Attributes>
</generic:Obs>

<generic:Obs>
<generic:ObsDimension value="2020-01-03"/>
<generic:ObsValue value="1.1147"/>
<generic:Attributes>
<generic:Value id="OBS_STATUS" value="A"/>
<generic:Value id="OBS_CONF" value="F"/>
</generic:Attributes>
</generic:Obs>

</data>'''

soup = BeautifulSoup(xml_doc, 'xml')

all_data = []
for obs in soup.select('Obs'):
    date = obs.ObsDimension['value']
    value = obs.ObsValue['value']
    all_data.append({'Date': date, 'Value': value})

df = pd.DataFrame(all_data)
print(df)

印花:

         Date   Value
0  2020-01-02  1.1193
1  2020-01-03  1.1147
© www.soinside.com 2019 - 2024. All rights reserved.