如何从EMR的S3存储桶中读取XML文件?

问题描述 投票:0回答:1

我已将XML文件存储在S3存储桶中,并希望在键入后在EMR上读取它们:

sqlContext.read.format("com.databricks.spark.xml").option("rowTag", "Profile").load(xml_file_path)

它给了我错误:

调用o445.load时发生错误。:java.lang.ClassNotFoundException:无法找到数据源:com.databricks.spark.xml。请在http://spark.apache.org/third-party-projects.html]中找到软件包

我已将XML文件存储在S3存储桶中,并希望在键入以下内容后在EMR上读取它们:sqlContext.read.format(“ com.databricks.spark.xml”)。option(“ rowTag”,“ Profile”)。load( xml_file_path)它给了我错误:...

xml amazon-web-services pyspark amazon-emr
1个回答
0
投票
  1. 通过Spark将正在运行的EMR群集上的spark-xml库安装到Link

© www.soinside.com 2019 - 2024. All rights reserved.