如何通过使用databrick向scala(spark)中的xml标签添加属性和值

问题描述 投票:0回答:1

我需要使用数据块在Spark Scala的显示名称标签中将“ xml:lang”作为属性添加,并将“ shirt”作为值添加。请帮忙。例如 - <display-name xml:lang="x-default">Shirt</display-name>

scala apache-spark databricks
1个回答
0
投票

一种方法是使用databricks spark-xml库,如下所示:

  1. 将spark-xml库导入您的工作空间或
  2. 将库附加到集群中

enter image description here

  1. 在笔记本中使用以下代码读取xml文件,其中“ note”是我的xml文件的根。

xmldata = spark.read.format('xml')。option(“ rootTag”,“ note”)。load('dbfs:/mnt/mydatafolder/xmls/note.xml')display(xmldata)

示例:

enter image description here

有关更多详细信息,请参见“ XML Data Sources for Apache Spark”。

希望这会有所帮助。

© www.soinside.com 2019 - 2024. All rights reserved.