Pandas.read_csv 将所有文件读取到一列中

问题描述 投票:0回答:5

我有一个 csv 文件,格式为“...”、“...”、“...”... 超过 40 列。 当我使用这个简单的代码时,它只给了我一个巨大的密钥。我已经搞乱它一个多小时了,我不知道如何使用 pandas 来解决这个问题。

dataframe = pd.read_csv(filePath, header=0, encoding='iso-8859-1')
datakeys = dataframe.keys();
print(datakeys)
python excel csv pandas anaconda
5个回答
7
投票

我通过指定

names
read_csv
header=None
字段解决了该问题。

fields = ["colA", "colB"];
df = pd.read_csv("/tmp/data.csv", sep="|", header=None, names=fields)

1
投票

由于这些答案不能让我满意,但我找到了另一种方法,我也在这里发布我的解决方案:

所以我使用“§”作为分隔符和

pandas-1.1.5
。然而,问题与提问者所描述的相同(除了分隔符)。我的解决方案是更新 pandas:

pip3 install --upgrade pandas

之后,与

    df = pd.read_csv(input_file_path, sep="§", encoding='utf8', quotechar='"', engine="python")

一切都很顺利。


0
投票

我通过编写脚本重新格式化 .csv 解决了这个问题 .csv 中存在一个小格式问题,导致 Panda 基本上什么也不做。奇怪


0
投票

这是一个老问题,但由于我最近遇到了同样的问题,我想我发布了为我解决的问题:

问题在于错误地设置了

sep=
参数。当放置适当的分隔符时(仔细检查您的数据文件是否有正确的分隔符!),它将文件读入正确的列数。

也许对其他人也有帮助。


0
投票

我可能有点晚了,但只要指定分隔符似乎就可以解决问题

© www.soinside.com 2019 - 2024. All rights reserved.