大熊猫读取额外的逗号和列报价CSV

问题描述 投票:0回答:1

我读其中列由逗号分隔基本CSV文件。然而,主体列是可以包含逗号和报价的字符串。例如,有一些细胞如"Bahamas\", The""Germany, West"

我曾尝试text = pd.read_table("input.txt", encoding = 'utf-16', quotechar='"', sep = ',')text = pd.read_table("input.txt", encoding = 'utf-16', quotechar='"', delimiter = ',')。但他们都不能工作。

有没有办法去解决这个问题呢?

python pandas
1个回答
1
投票

您是否能够重新生成CSV?如果是,则划字符更改为管道,即| 。如果没有,你可能会被迫走冤枉路......因为没有办法对任何代码,找出哪些字符被划定/报价,哪些是值的一部分,如果你有两个逗号和报价潜伏在里面的值。

一种解决方法可能涉及利用那里出现此问题列位置......即第一,你可以列隔离的困扰列的左侧,隔离所有列在右边,然后剩下的所有字符都是你的困扰列。您可以张贴一些示例行?这将是很好地看到,有这个问题几行,那做工精细几

© www.soinside.com 2019 - 2024. All rights reserved.