我有一个 Java 存储过程,它使用
Resultset
对象从表中获取记录并创建一个 CS Vfile。
BLOB retBLOB = BLOB.createTemporary(conn, true, BLOB.DURATION_SESSION);
retBLOB.open(BLOB.MODE_READWRITE);
OutputStream bOut = retBLOB.setBinaryStream(0L);
ZipOutputStream zipOut = new ZipOutputStream(bOut);
PrintStream out = new PrintStream(zipOut,false,"UTF-8");
out.write('\ufeff');
out.flush();
zipOut.putNextEntry(new ZipEntry("filename.csv"));
while (rs.next()){
out.print("\"" + rs.getString(i) + "\"");
out.print(",");
}
out.flush();
zipOut.closeEntry();
zipOut.close();
retBLOB.close();
return retBLOB;
但生成的 CSV 文件未显示正确的德语字符。 Oracle 数据库的
NLS_CHARACTERSET
值也为 UTF8。
请推荐。
BufferedWriter out = new BufferedWriter(new OutputStreamWriter(new FileOutputStream(...), StandardCharsets.UTF_8));
out.write('\ufeff');
out.write(...);
这会正确地将 0xEF 0xBB 0xBF 写入文件,这是 BOM 的 UTF-8 表示形式。
以防万一人们正在使用PrintStream
,您需要采取一些不同的做法。虽然
Writer
可以发挥一些神奇作用将单个字节转换为 3 个字节,但
PrintStream
需要单独使用 UTF-8 BOM 的所有 3 个字节:
// Print utf-8 BOM
PrintStream out = System.out;
out.write('\ufeef'); // emits 0xef
out.write('\ufebb'); // emits 0xbb
out.write('\ufebf'); // emits 0xbf
或者,您可以直接使用十六进制值:
PrintStream out = System.out;
out.write(0xef); // emits 0xef
out.write(0xbb); // emits 0xbb
out.write(0xbf); // emits 0xbf
PrintStream.print()
,而不是
PrintStream.write()
。另外,如果您想在
csv
文件中包含BOM,我想您需要在
putNextEntry()
之后打印BOM。
PrintStream#print
out.write('\ufeff');
实际上应该是
out.print('\ufeff');
,调用
java.io.PrintStream#print
方法。
根据 javadoc,write(int)
方法实际上写入一个字节......没有任何字符编码。因此
out.write('\ufeff');
写入字节
0xff
。相比之下,
print(char)
方法使用流的编码将字符编码为一个或多个字节,然后写入这些字节。如 Unicode 9
规范第 23.8 节所述,UTF-8 的 BOM 为 EF BB BF
。该序列就是在
'\ufeff'
上使用 UTF-8 编码时得到的结果。请参阅:为什么 UTF-8 BOM 字节 efbbbf 可以替换为 \ufeff?。
String CSV = "";
byte[] BOM = {(byte) 0xEF,(byte) 0xBB,(byte) 0xBF};
CSV = new String(BOM) + CSV;
这对我有用。
修改同一个文件
private void addBOM(File fileInput) throws IOException {
try (RandomAccessFile file = new RandomAccessFile(fileInput, "rws")) {
byte[] text = new byte[(int) file.length()];
file.readFully(text);
file.seek(0);
byte[] bom = { (byte) 0xEF, (byte) 0xBB, (byte) 0xBF };
file.write(bom);
file.write(text);
}
}
PrintWriter out = new PrintWriter(new File(filePath), "UTF-8");
out.write(csvContent);
out.flush();
out.close();
private static void appendBOM(File file) throws Exception {
File bomFile = new File(file + ".bom");
try (FileOutputStream output = new FileOutputStream(bomFile, true)) {
byte[] bytes = FileUtils.readFileToByteArray(file);
output.write('\ufeef'); // emits 0xef
output.write('\ufebb'); // emits 0xbb
output.write('\ufebf'); // emits 0xbf
output.write(bytes);
output.flush();
}
file.delete();
bomFile.renameTo(file);
}
StringBuilder csv = new StringBuilder();
csv.append('\ufeff');
csv.append(content);
csv.toString();
try (BufferedWriter bufferedWriter = new BufferedWriter(
new OutputStreamWriter(
new FileOutputStream(fullpath, true), StandardCharsets.UTF_8))) {
bufferedWriter.write('\ufeff');
.
.
출력
.
.
}