我正在尝试将一些推文导出到json文件中,但是我遇到了错误。当我没有收到错误时,它会在我的数据中加上一个“b”字符,因此会混淆我的json格式。这是我的示例和代码:
这里是'推文'的内容:['小米Redmi 6 64GB / 4GB手机vs \ n华为Honor 8X 64GB手机\ n参数是86 ......“,'小米Rilis Redmi Note 7 Pro di India,Ini Spesifikasinya “]
然后我转换为字符串:
tweets2=str(tweets)
当我尝试导出它时:
with open("tw_stream.jsonl", 'a') as f:
f.write(tweets2)
我收到以下错误:
UnicodeEncodeError: 'charmap' codec can't encode characters in position 2-
10: character maps to <undefined>
所以问题是我试图删除字符串的'b \'部分因为它不是有效的json,但是这样做我不能将外来字符编码为“utf-8”......
如果有人可以提供帮助,我将不胜感激。
谢谢 :-)
您可以通过传递param encoding =“utf-8”来使用utf-8编码。