如何在Java中添加UTF-8 BOM?

问题描述 投票:0回答:10

我有一个 Java 存储过程,它使用

Resultset
对象从表中获取记录并创建一个 CS Vfile。

BLOB retBLOB = BLOB.createTemporary(conn, true, BLOB.DURATION_SESSION);
retBLOB.open(BLOB.MODE_READWRITE);
OutputStream bOut = retBLOB.setBinaryStream(0L);

ZipOutputStream zipOut = new ZipOutputStream(bOut);
PrintStream out = new PrintStream(zipOut,false,"UTF-8");
out.write('\ufeff');
out.flush();

zipOut.putNextEntry(new ZipEntry("filename.csv"));
while (rs.next()){
    out.print("\"" + rs.getString(i) + "\"");
    out.print(",");
}
out.flush();

zipOut.closeEntry();
zipOut.close();
retBLOB.close();

return retBLOB;

但生成的 CSV 文件未显示正确的德语字符。 Oracle 数据库的

NLS_CHARACTERSET
值也为 UTF8。

请推荐。

java character-encoding oracle10g byte-order-mark
10个回答
83
投票
BufferedWriter out = new BufferedWriter(new OutputStreamWriter(new FileOutputStream(...), StandardCharsets.UTF_8));
out.write('\ufeff');
out.write(...);

这会正确地将 0xEF 0xBB 0xBF 写入文件,这是 BOM 的 UTF-8 表示形式。


17
投票

以防万一人们正在使用PrintStream

,您需要采取一些不同的做法。虽然 
Writer
 可以发挥一些神奇作用将单个字节转换为 3 个字节,但 
PrintStream
 需要单独使用 UTF-8 BOM 的所有 3 个字节:

// Print utf-8 BOM PrintStream out = System.out; out.write('\ufeef'); // emits 0xef out.write('\ufebb'); // emits 0xbb out.write('\ufebf'); // emits 0xbf

或者,您可以直接使用十六进制值:

PrintStream out = System.out; out.write(0xef); // emits 0xef out.write(0xbb); // emits 0xbb out.write(0xbf); // emits 0xbf
    

13
投票
要以 UTF-8 编写 BOM,您需要

PrintStream.print()

,而不是 
PrintStream.write()

另外,如果您想在

csv

文件中包含BOM,我想您需要在
putNextEntry()
之后打印BOM。


11
投票

PrintStream#print

我认为

out.write('\ufeff');

实际上应该是
out.print('\ufeff');
,调用
java.io.PrintStream#print
方法。

根据

javadocwrite(int)

方法实际上写入一个字节......没有任何字符编码。因此 
out.write('\ufeff');
 写入字节 
0xff
。相比之下,
print(char)
方法使用流的编码将字符编码为一个或多个字节,然后写入这些字节。

如 Unicode 9

规范第 23.8 节所述,UTF-8 的 BOM 为 EF BB BF。该序列就是在

'\ufeff'
上使用 UTF-8 编码时得到的结果。请参阅:
为什么 UTF-8 BOM 字节 efbbbf 可以替换为 \ufeff?
    


9
投票

String CSV = ""; byte[] BOM = {(byte) 0xEF,(byte) 0xBB,(byte) 0xBF}; CSV = new String(BOM) + CSV;

这对我有用。


2
投票

修改同一个文件

(没有新文件并删除旧文件,因为我遇到了问题)

private void addBOM(File fileInput) throws IOException { try (RandomAccessFile file = new RandomAccessFile(fileInput, "rws")) { byte[] text = new byte[(int) file.length()]; file.readFully(text); file.seek(0); byte[] bom = { (byte) 0xEF, (byte) 0xBB, (byte) 0xBF }; file.write(bom); file.write(text); } }



0
投票

PrintWriter out = new PrintWriter(new File(filePath), "UTF-8"); out.write(csvContent); out.flush(); out.close();



0
投票

private static void appendBOM(File file) throws Exception { File bomFile = new File(file + ".bom"); try (FileOutputStream output = new FileOutputStream(bomFile, true)) { byte[] bytes = FileUtils.readFileToByteArray(file); output.write('\ufeef'); // emits 0xef output.write('\ufebb'); // emits 0xbb output.write('\ufebf'); // emits 0xbf output.write(bytes); output.flush(); } file.delete(); bomFile.renameTo(file); }



0
投票

StringBuilder csv = new StringBuilder(); csv.append('\ufeff'); csv.append(content); csv.toString();


"

0
投票
\n"

try (BufferedWriter bufferedWriter = new BufferedWriter( new OutputStreamWriter( new FileOutputStream(fullpath, true), StandardCharsets.UTF_8))) { bufferedWriter.write('\ufeff'); . . 출력 . . }

© www.soinside.com 2019 - 2024. All rights reserved.