从文本文件读取阿拉伯语文本并将输出保存为 json

问题描述 投票:0回答:2

我对图像进行了 ocr 来提取阿拉伯语内容。我使用

将输出存储在文本文件中
f=open(filename,'w',encoding='utf-8') 
f.write(text)
f.close()

txt 文件中的输出是可读的。但是当我使用

读取txt文件时
file=open(filename,'r',encoding='utf-8')
json[name]=file.read()

我得到了这个我无法解决的奇怪编码

json text encoding arabic txt
2个回答
0
投票

事实证明,问题出在使用 dump 时的 json,我更改了 Ensure_ascii=False 并保持原样。 同样的问题,但是是json


0
投票

{"karim.szm84":[{"来自":"maram_dahab20","媒体类型":"STATUSCONVERSATIONCREATED","已创建":"2024-04-06 05:00:26 UTC","内容":null ,"对话标题":null,"IsSender":true,"已创建(微秒)":1712379626098}]}

© www.soinside.com 2019 - 2024. All rights reserved.