Python使用退出代码-1073741819终止进程

问题描述 投票:3回答:1

我正在尝试将csv文件(大小约为190MB)读入pandas数据帧,但我收到此错误。我正在从JetBrains运行Pycharm IDE

Process finished with exit code -1073741819 (0xC0000005)

我试图运行的代码如下:

from pandas import DataFrame as df


if __name__ == '__main__':
    frame = df()
    frame.from_csv('c:/Nitin/692/Python/CSV/21LIVvTOT_user_geo_Reply.csv', header=True)
    ab = list(frame.columns.values)
    print(ab)

以下是CSV中的实例:

createdat   text    coordinates entities    id_str  in_reply_to_user_id_str
Tue Feb 10 18:56:42 +0000 2015  

"RT @RubieDubes: official list of deluded XXXXX: 
Spurs Fans
Kanye West 
Louis van Gaal"     

{'trends': [], 'urls': [], 'user_mentions': [{'id': 65174814, 'name': 'Ruby ?', 'screen_name': 'RubieDubes', 'indices': [3, 14], 'id_str': '65174814'}], 'symbols': [], 'hashtags': []} 

5.65223E+17 

编辑:我尝试使用python控制台运行它,它导致错误:python.exe [11640]发生未处理的win32异常。

python pandas csv utf
1个回答
2
投票

我弄清楚问题是什么。 CSV中的值与解析器未正确读取的值相同。我改变了代码

frame.from_csv('c:/Nitin/692/Python/CSV/21LIVvTOT_user_geo_Reply.csv', header=True)

data = pandas.read_csv('c:/Nitin/692/Python/CSV/21LIVvTOT_user_geo_Reply.csv', encoding='latin-1', engine='python')

猜猜utf-8中的编码导致了这个问题。代码在我将其更改为'latin-1时运行。谢谢您的帮助。

编辑:我认为这是由于数据中存在表情符号引起的。

© www.soinside.com 2019 - 2024. All rights reserved.