使用scala将逗号分隔的字符串和spark中的空格分隔开

问题描述 投票:0回答:1

我正在尝试使用以下格式读取文本文件

1980, Jan, Wednesday
1982, Feb, Monday
1987, March, Thursday

我尝试用逗号和空格分隔每个字符串,代码如下:

val line = sc.textFile("file.txt") 
val lineMap = line.map(x => x.split("[,]+"))

但这给了java.lang.ArrayIndexOutOfBoundsException

如何解决这个问题呢?

string scala apache-spark
1个回答
3
投票

TLDR使用:

val line = sc.textFile("file.txt") 
val lineMap = line.map(x => x.split(",\\s"))

见:https://imgur.com/a/mi1waOa

© www.soinside.com 2019 - 2024. All rights reserved.