将字符集更改为UTF-8

问题描述 投票:0回答:1

[当我尝试通过pgAdmin上传CSV时,出现此错误:编码UTF-8的字节序列无效。我该如何解决?文件的原始字符集应为unkown-8bit。我已经尝试使用iconv了,但是没有用,所以我尝试使用enca,但是出现了这个错误:语言“ it”未知或不受支持。如何将文件的字符集更改为UTF8?

sql postgresql utf-8 character-encoding
1个回答
0
投票

“这没用”不是受人尊敬的程序员会选择的问题描述。

您首先必须找出数据的编码。在Linux上可以帮助您的一种工具是file

file csvfile

通常会给您很好的编码猜测。

然后使用]进行转换>

iconv -f original_encoding -t UTF-8 <csvfile >newfile

如果失败,它将准确告诉您哪些字节有问题。使用这些信息,您可以更好地猜测文件的编码。

如果文件包含各种不同编码的数据,则必须手动进行修复。

© www.soinside.com 2019 - 2024. All rights reserved.