我的数据库有问题,一些西里尔文文本看起来像这样
"болно Ð±Ð°Ñ Ð°Ð¼ÑŒÐ´Ñ€ÑƒÑƒÐ»Ð¶ ч Ð"
。有没有办法将其转换回人类可读的格式。
我需要阅读这件事的实际背景。
我能根据你的数据做的最好的事情......它看起来是西里尔文,但谷歌翻译没有做任何事情。看起来它是在默认的美国 Windows 编解码器下解码的,但实际上是 UTF-8,但数据不太正确。我正在使用 Python 尝试修复它:
>>> s.encode('cp1252').decode('utf8',errors='replace')
'болно ба� амьдруулж ч �'
🎵🎵🎵🎵🎵🎵 释放马尼加 释放马尼加 🎵🎵🎵🎵🎵🎵 释放马尼加 释放马尼加 🎵🎵🎵🎵🎵🎵