我正在尝试从pysaprk中的csv读取Non-Ascii字符,特别是csv包含西班牙语国家/地区的名称,所以我有ESPAÑA(西班牙语为西班牙),但它的读取为ESPA�OLA
ESPAÑA
ESPA�OLA
这是我正在使用的代码:
df = sqlContext.read.csv("path", sep=",", header=True )
我找不到sqlContext.read接受的所有编码,我试图使用latin-1,但收到一条消息,提示它不受支持
sqlContext.read
latin-1
是否可以将文件转换为UTF-8编码之前