我正在尝试在table hive中保存数据帧。
在Spark 1.6中它可以工作但是在迁移到2.2.0之后它不再起作用了。
这是代码:
blocs
.toDF()
.repartition($"col1", $"col2", $"col3", $"col4")
.write
.format("parquet")
.mode(saveMode)
.partitionBy("col1", "col2", "col3", "col4")
.saveAsTable("db".tbl)
现有表project_bsc_dhr.bloc_views的格式是HiveFileFormat
。它与指定的格式ParquetFileFormat
不匹配。 org.apache.spark.sql.AnalysisException:现有表project_bsc_dhr.bloc_views的格式为HiveFileFormat
。它与指定的格式ParquetFileFormat
不匹配。
我刚刚在收到错误后尝试使用.format("hive")
来saveAsTable
并且它有效。
我也不建议使用作者建议的insertInto
,因为它看起来不是类型安全的(尽管这个术语可以应用于SQL API)并且在忽略列名和使用位置库的方式上容易出错解析度。