更改csv文件中的定界符-Python

问题描述 投票:0回答:2

这是我第一次使用堆栈溢出,所以请不要对此进行否决(相反,请提供有关如何更好地表达我的问题的反馈)。

我在Google colab(python)中有一个名为'student-mat.csv'的csv文件当我打印它时,它看起来像这样:

school;sex;age;address;famsize;Pstatus;Medu;Fedu;Mjob;Fjob;reason;guardian;traveltime;studytime;failures;schoolsup;famsup;paid;activities;nursery;higher;internet;romantic;famrel;freetime;goout;Dalc;Walc;health;absences;G1;G2;G3

分隔符是错误的,我不知道如何更改它,因为它不是像这样编写简单的代码:df = pd.read_csv('student-mat.csv')

我必须写这个:df = pd.read_csv(io.StringIO(uploaded['student-mat.csv',delimiter=';'].decode('utf-8'))) print(df.head())

这是因为我上传文件的方式不同。当我键入该代码时,这是不正确的,因为分隔符位于错误的位置。它给出了一个简单的SyntaxError: invalid syntax

python pandas csv io delimiter
2个回答
0
投票

为什么您要使自己的生活复杂化?只需使用

df = pd.read_csv('student-mat.csv', sep=';', encoding='utf-8')

请参见pandas.read_csv


0
投票

分隔符需要放在这里:

df = pd.read_csv(io.StringIO(uploaded['student-mat.csv'].decode('utf-8')), delimiter=';')

print(df.head())

然后将其返回到pandas DataFrame中。

© www.soinside.com 2019 - 2024. All rights reserved.