用于äööß的编码

问题描述 投票:0回答:1

我有一个字符串列表,其中一些包含äüö或ß等字母。尝试打印它们会导致产生字符串,例如Natürlich或Bedrückung。如其他主题所建议,我尝试通过以下方法解决问题:

str(word).encode("latin-1").decode("utf-8")

但是,现在我收到这样的字符串:Verkehrsl \ xc3 \ x83 \ xc2 \ xa4rm,Windb \ xc3 \ x83 \ xc2 \ xb6,Gro \ xc3 \ x83 \ xc5 \ xb8stadt

这些值是使用spacy和nlp从一本书中刮取的。

我有一个字符串列表,其中一些包含äüö或ß等字母。尝试打印它们会导致产生字符串,例如Natürlich或Bedrückung。正如其他线程所建议的那样,我尝试了...

python utf-8 nlp nltk
1个回答
0
投票

如果您有类似Natürlich的字符串,那么您的问题所采用的方法应该有效:

© www.soinside.com 2019 - 2024. All rights reserved.