“ascii”编解码器无法解码位置 0 中的字节 0xef:序号不在范围内(128):BookNLP

问题描述 投票:0回答:1

我尝试在 Colab 中的 txt 文件上运行 BookNLP 模型,但我不断收到错误。

代码:

input_file="alice.txt"
output_directory="alice"
book_id="alice"

booknlp.process(input_file, output_directory, book_id)

错误:

---------------------------------------------------------------------------
UnicodeDecodeError                        Traceback (most recent call last)
<ipython-input-16-7fd43958471a> in <cell line: 6>()
      4 book_id="alice"
      5 
----> 6 booknlp.process(input_file, output_directory, book_id)

2 frames
/usr/lib/python3.10/encodings/ascii.py in decode(self, input, final)
     24 class IncrementalDecoder(codecs.IncrementalDecoder):
     25     def decode(self, input, final=False):
---> 26         return codecs.ascii_decode(input, self.errors)[0]
     27 
     28 class StreamWriter(Codec,codecs.StreamWriter):

UnicodeDecodeError: 'ascii' codec can't decode byte 0xef in position 0: ordinal not in range(128)

查看有关相同错误的其他帖子,我知道我应该将编码设置为 UTF-8,但我有点不确定在这种特殊情况下如何执行此操作。

utf-8 nlp character-encoding ascii text-processing
1个回答
0
投票

你解决了吗,我目前面临同样的问题

© www.soinside.com 2019 - 2024. All rights reserved.