带有nltk的UnicodeDecodeError

问题描述 投票:0回答:1

[我正在使用python2.7和nltk处理从各个网站上抓取的内容的大型txt文件。但是我遇到各种unicode错误,例如

UnicodeDecodeError: 'ascii' codec can't decode byte 0xe2 in position 6: ordinal not in range(128)

我的问题不是我怎么能用python'解决'这个问题,而是在将'txt'文件馈送到python之前,我可以对.txt文件做任何事情(如格式化),例如'make plain text'完全避免这个问题?

python nltk python-unicode
1个回答
0
投票

尝试通过以下方式打开文件:

© www.soinside.com 2019 - 2024. All rights reserved.