引号内的python pandas分隔符导致错误标记化

问题描述 投票:2回答:2

我有一个包含如下数据的.csv:

....
"4", "mercedes", "BLT254", "Arkis-UDV GmbH, Berlin, Oberweg", "2007"
"5", "bmw", "SUV873", "Meier Auto", "2013"
....

我尝试通过read_csv阅读它:

data = pd.read_csv("Auszug_2020.csv", sep = ",", encoding = "ISO-8859-1", quotechar = '"')

每个数据都包裹在一个“”内。在引号内,有时会出现分隔符“,”。那是个问题!我以为可以通过使用quoechar ='“'来解决此问题,但不幸的是它仍然无法正常工作。

ParserError:标记数据时出错。 C错误:第4行中应有5个字段,看到7

我在做什么错?

我有一个.csv,其中包含以下数据:....“ 4”,“ mercedes”,“ BLT254”,“ Arkis-UDV GmbH,柏林,奥伯维格”,“ 2007”“ 5”,“宝马” ,“ SUV873”,“ Meier Auto”,“ 2013”​​...。我尝试通过...

python pandas separator
2个回答
0
投票

按照您共享的样本数据,您可以尝试这样读取它:


0
投票

使用skipinitialspace=True方法中的可选参数pd.read_csv来跳过分隔符,后的空格,这将产生所需的结果:

© www.soinside.com 2019 - 2024. All rights reserved.