如何使用scala.io.Source删除字节顺序标记?

问题描述 投票:0回答:1

当使用Byte order mark从文件中读取时,scala.io.Source正在使我的正则表达式失败。 This answer是使用java.io的轻量级解决方案。 scala.io.Source有什么类似的东西,还是因为一个字节而必须恢复到Java?

java scala io byte-order-mark
1个回答
0
投票

基于Joe K在他的评论中的想法,并使用Andrei Punko's answer来解决Java和Alvin Alexander's Scala code中的问题,将可能包含字节顺序标记的文件读入字符串数组的最简单的解决方案是:

@throws[IOException]
def skip(reader: Reader): Unit = {
    reader.mark(1)
    val possibleBOM = new Array[Char](1)
    reader.read(possibleBOM)
    if (possibleBOM(0) != '\ufeff') reader.reset
}

val br = new BufferedReader(new InputStreamReader(new FileInputStream(file)))
skip(br)

val lines = {
    val ls = new ArrayBuffer[String]()
    var l: String = null
    while ({l= br.readLine; l != null}) {
      ls.append(l)
    }
    br.close
    ls.toArray
}
© www.soinside.com 2019 - 2024. All rights reserved.