如何在python中的列名中替换瑞典字符ä，å，ö？

Question

我有一个数据框，其中一些列名称具有瑞典字符（ö，ä，å）。我想用简单的o，a，a代替这些字符。

我试图将列名转换为str并替换字符，它可以工作但是如果我想将str作为列名称分配回来它会变得复杂，即，需要多个操作使其变得复杂。

我尝试了以下代码，用英文字母替换列名中的瑞典字符，并将结果返回为str。

from unidecode import unidecode
unicodedata.normalize('NFKD',str(df.columns).decode('utf-8')).encode('ascii', 'ignore')

有没有办法使用返回的str作为数据帧的列名？如果没有，那么有更好的方法来替换列名中的瑞典字符吗？

Answer 1

对我来说，首先进行规范化，然后编码为ascii，最后解码为utf-8：

df = pd.DataFrame(columns=['aä','åa','oö'])

df.columns = (df.columns.str.normalize('NFKD')
                        .str.encode('ascii', errors='ignore')
                        .to_series()
                        .str.decode('utf-8'))
print (df)
Empty DataFrame
Columns: [aa, aa, oo]
Index: []

使用map或列表理解的另一种解决方案：

import unicodedata

f = lambda x: unicodedata.normalize('NFKD', x).encode('ascii', 'ignore').decode('utf-8')
df.columns = df.columns.map(f)
print (df)
Empty DataFrame
Columns: [aa, aa, oo]
Index: []

import unicodedata

df.columns = [unicodedata.normalize('NFKD', x).encode('ascii', 'ignore').decode('utf-8') 
                     for x in df.columns]
print (df)
Empty DataFrame
Columns: [aa, aa, oo]
Index: []

Answer 2

当你有很多列时，这可能是很多手工工作，但一种方法是使用str.replace，如下所示：

    bänk  röund
0   1     3
1   2     4
2   3     5

df.columns = df.columns.str.replace('ä', 'a')
df.columns = df.columns.str.replace('ö', 'o')


    bank  round
0   1     3
1   2     4
2   3     5

如何在python中的列名中替换瑞典字符ä，å，ö？

问题描述投票：0回答：2

2个回答

最新问题

如何在python中的列名中替换瑞典字符ä，å，ö？

问题描述 投票：0回答：2

2个回答

最新问题

问题描述投票：0回答：2