如何使用 Glue 作业将 JSON 从 s3 转换为 CSV 文件并将其保存在同一个 s3 存储桶中

问题描述 投票:0回答:1

请帮助我完成编码部分

我用谷歌搜索了代码,但它只显示使用 lambda 处理程序。我的项目需要使用gluejob。

python amazon-web-services amazon-s3 aws-lambda aws-glue
1个回答
0
投票

在这里您可以找到将 json 转换为 csv 的答案。

GlueContext glueContext = new GlueContext(Spark.getActiveSession())

val jsonDf = glueContext.getSource(
      connectionType = "s3",
      connectionOptions = JsonOptions(Map("paths" -> "s3://:sourcePath/data.json")),
      format = "json",
      transformationContext = "jsonDf"
    )

val dataDf = jsonDf.toDF()
val csvRDD = dataDf.repartition(1).rdd.map(_.mkString(","))
csvRDD.saveAsTextFile("s3://sourcePath/data.csv")
© www.soinside.com 2019 - 2024. All rights reserved.