我对图像进行了 ocr 来提取阿拉伯语内容。我使用
将输出存储在文本文件中f=open(filename,'w',encoding='utf-8')
f.write(text)
f.close()
txt 文件中的输出是可读的。但是当我使用
读取txt文件时file=open(filename,'r',encoding='utf-8')
json[name]=file.read()
我得到了这个我无法解决的奇怪编码
事实证明,问题出在使用 dump 时的 json,我更改了 Ensure_ascii=False 并保持原样。 同样的问题,但是是json
{"karim.szm84":[{"来自":"maram_dahab20","媒体类型":"STATUSCONVERSATIONCREATED","已创建":"2024-04-06 05:00:26 UTC","内容":null ,"对话标题":null,"IsSender":true,"已创建(微秒)":1712379626098}]}