PySpark - 读取文本文件并忽略行内的换行

问题描述 投票:0回答:0

我有一个格式如下的文本文件:

A,"123 Main St
Lincoln, NE 55555",13343
B,"345 School St",23432

我想将其作为 2 行而不是 3 行摄取,但是有没有办法在使用

\n
初始摄取数据框或 RDD 时使用 RegEx 忽略引用字段中的
spark.read
字符?

在我拥有 df 中的所有行之后,我打算处理数据并将其拆分为另一个 df 中的列。

dataframe apache-spark pyspark rdd
© www.soinside.com 2019 - 2024. All rights reserved.