我有一个关于
read_csv
的问题,需要很长时间才能解决。
我正在处理具有多个特殊字符的文本,因此我检查了哪个字符不在文本列表中,并在编写用相应 ID 分隔文本的
csv
文件时选择 § 作为分隔符。
但是,在读取文件时,我收到以下错误。我可以跳过不好的台词,但在这种情况下,我不能丢失任何文本。
ParserError: '§' expected after '"'
写作
df.to_csv('20231010.csv',
index=False,
sep='§',
#header=None,
quoting=csv.QUOTE_NONE,
quotechar="",
escapechar=" ")
阅读
data = pd.read_csv('20231010.csv', sep ="§", encoding='utf-8')
禁用引用是没有意义的,实际上你甚至不需要使用花哨的字符,只需使用默认设置即可:
df = pd.DataFrame({'text1': ['abc"123§', 'def§,456'],
'text2': ['ghi`789', 'jkl|123'],
})
df.to_csv('20231010.csv', index=False)
CSV:
text1,text2
"abc""123§",ghi`789
"def§,456",jkl|123
再次导入:
df2 = pd.read_csv('20231010.csv')
print(df2)
输出:
text1 text2
0 abc"123§ ghi`789
1 def§,456 jkl|123