我正在尝试读取由|分隔的文本文件。我正在尝试这个
spark.read.format("com.databricks.spark.csv").option("header","true").option("delimiter", "|").option("inferSchema","true").csv("/tmp/file.txt").show()
我只读/看标题但没有数据。
当我尝试使用textFile进行相同操作时,我正在获取数据,但全部集中在一栏中
spark.read.format("com.databricks.spark.csv").option("header","true").option("delimiter", "|").option("inferSchema","true").textFile("/tmp/file.txt").show()
是否可以通过csv读取数据?我正在使用spark 2.4.4
spark.sparkContext.textFile
返回RDD[String]
spark.read.csv
返回DataFrame
来自textFile vs csv
textFile vs csv
具有内置的spark2.0+
,可以由spark session()
(或)csv package访问。
spark.read.csv
spark.read.format("csv")
问题的原因是该文件位于UTF16中,所以我不得不对其进行转换并在其上运行dostounix。谢谢你的建议。道歉,我真的不知道