[当我尝试通过pgAdmin上传CSV时,出现此错误:编码UTF-8的字节序列无效。我该如何解决?文件的原始字符集应为unkown-8bit。我已经尝试使用iconv了,但是没有用,所以我尝试使用enca,但是出现了这个错误:语言“ it”未知或不受支持。如何将文件的字符集更改为UTF8?
“这没用”不是受人尊敬的程序员会选择的问题描述。
您首先必须找出数据的编码。在Linux上可以帮助您的一种工具是file
:
file csvfile
通常会给您很好的编码猜测。
然后使用]进行转换>
iconv -f original_encoding -t UTF-8 <csvfile >newfile
如果失败,它将准确告诉您哪些字节有问题。使用这些信息,您可以更好地猜测文件的编码。
如果文件包含各种不同编码的数据,则必须手动进行修复。