Pandas read_csv EOF在字符串中从行开始

问题描述 投票:0回答:1

我正面临着pandas read_csv的问题。我有一个文件,其中包含“作为字段值。实际上,情况应该不是这样,但我对文件生成没有影响,因此我必须找到一个解决方法。

pandas.errors.ParserError:标记数据时出错。 C错误:字符串中的EOF从第15345行开始

我在Git(link here)上发现了一个关于此的问题报告,他们建议在“quotechar”中使用用于“sep”参数的分隔符。在这种情况下,文件结构搞砸了。

我做的另一件事是添加一个例外,它将运行其余文件的代码,但我将继续针对该特定类型的文件存在该问题。

我用来读取CSV文件的命令:

df_new = pd.read_csv(file_path_name, sep=";", error_bad_lines=False)

对此有任何解决方法的想法(例如忽略此问题的行)?我想的一种方法是使用csv库删除该行(或用其他东西替换“),但我想保持简单,并尽可能在熊猫中做。

Python版本:3.6.2

熊猫版:0.21.0

感谢你并致以真诚的问候

python pandas eof
1个回答
0
投票

只想指出来自@ user8505495的建议有效(再次谢谢你)。

基本上只是将参数quoting=3添加到read_csv。在to_csv中使用相同的参数导致和错误(缺少转义字符)。一种选择是设置escapechar参数,或者不使用quoting参数。

© www.soinside.com 2019 - 2024. All rights reserved.