我正在使用Python,我有一堆列,被添加了一些符号。
所以,如果一列曾经是 "A",它现在说"('A', '')"。所以我需要删除('和','')。有些变量(更准确的说是400)本来应该叫 "1 A",但现在却叫"('A',1)"。所以对于这些变量,我需要去掉('和',),并将数字移到A的前面。在使用pivot_table命令后,它们就变成了这样。
所以我需要从之前到之后。
data_before = {"('A', '')" : ['a', 'b', 'c'],
"('B', '')" : ['p', 'o', 'n'],
"('C', 1)" : [1, 1, 1],
"('C', 2)" : [1, 2, 1],
"('D', 1)" : [1, 2, 4],
"('D', 2)" : [1, 5, 3]}
df = pd.DataFrame(data=data_before)
data_after = {'A' : ['a', 'b', 'c'],
'B' : ['p', 'o', 'n'],
'1 C' : [1, 1, 1],
'2 C' : [1, 2, 1],
'1 D' : [1, 2, 4],
'2 D' : [1, 5, 3]}
df_2 = pd.DataFrame(data=data_after)
记住,有42个像C和D这样的变量 每个变量都是从1到10(不只是2),所以有420列。我不想把它们每个都手动写下来改名字。只有前3个变量看起来像A和B(共423列)。
更新以适应更多的字母和数字。所以1 C,2 C... 10 C和1 Z,2 Z......。10 Z.
data_before = {"('A', '')" : ['a', 'b', 'c'],
"('B', '')" : ['p', 'o', 'n'],
"('C', 1)" : [1, 1, 1],
"('C', 2)" : [1, 2, 1],
"('C', 3)" : [3, 2, 1],
"('D', 1)" : [1, 2, 3],
"('D', 2)" : [1, 2, 3],
"('D', 3)" : [1, 2, 3],
"('E', 1)" : [1, 1, 1],
"('E', 2)" : [1, 2, 1],
"('E', 3)" : [3, 2, 1]}
df = pd.DataFrame(data=data_before)
data_after = {'A' : ['a', 'b', 'c'],
'B' : ['p', 'o', 'n'],
'1 C' : [1, 1, 1],
'2 C' : [1, 2, 1],
'3 C' : [3, 2, 1],
'1 D' : [1, 2, 3],
'2 D' : [1, 2, 3],
'3 D' : [1, 2, 3]
'1 E' : [1, 1, 1],
'2 E' : [1, 2, 1],
'3 E' : [3, 2, 1]}
df_2 = pd.DataFrame(data=data_after)
这个命令。
df.columns = [f'{b} {a}'.strip() for a, b in df.columns]
返回:
ValueError: too many values to unpack (expected 2)
如果有元组或 MultiIndex
可以使用 f-strings
与 strip
:
data_before = {('A', '') : ['a', 'b', 'c'],
('B', '') : ['p', 'o', 'n'],
('C', 1) : [1, 1, 1],
('C', 2) : [1, 2, 1],
('D', 1) : [1, 2, np.NaN],
('D', 2) : [1, np.NaN, 3]}
df = pd.DataFrame(data=data_before)
df.columns = [f'{b} {a}'.strip() for a, b in df.columns]
print (df)
A B 1 C 2 C 1 D 2 D
0 a p 1 1 1.0 1.0
1 b o 1 2 2.0 NaN
2 c n 1 1 NaN 3.0
EDIT:
import ast
df.columns = [f'{b} {a}'.strip() for a, b in df.columns.map(ast.literal_eval)]
print (df)
A B 1 C 2 C 3 C 1 D 2 D 3 D 1 E 2 E 3 E
0 a p 1 1 3 1 1 1 1 1 3
1 b o 1 2 2 2 2 2 1 2 2
2 c n 1 1 1 3 3 3 1 1 1
你只需要先把所有无用的字符去掉,然后再把字符串拆开并倒过来。
import re
df.columns = [" ".join(reversed(re.sub(r"\)|\(|'|,", "", x).split()))
for x in df.columns]