写入文本文件 - 'ascii'编解码器无法编码字符

问题描述 投票:1回答:2

我在将文本图像中的单词输出到.txt文件时遇到了一些麻烦。

import pytesseract
from PIL import Image, ImageEnhance, ImageFilter

text = pytesseract.image_to_string(Image.open("book_image.jpg"))

file = open("text_file","w")
file.write(text)
print(text)

读取图像文件并打印出图像上的文字的代码工作正常。问题是当我尝试获取文本并将其写入文件时,我收到以下错误;

UnicodeEncodeError:'ascii'编解码器无法对位置366中的字符u'\ u2019'进行编码:序数不在范围内(128)

任何人都可以解释我如何将变量text转换为字符串?

python python-tesseract
2个回答
1
投票

试试这个:

file = open("text_file", "w", encoding='utf8', errors="ignore")

0
投票

还试试:

file.write(text).encode('utf-8').strip()
© www.soinside.com 2019 - 2024. All rights reserved.