所以我有这个DF:
In [130]: dfAbr
Out[130]:
ip ospfArea router_name
0 1.1.1.1 0.0.0.2 Router1-1
1 1.1.1.2 0.0.0.2 Router1-2
140 5.5.5.1 0.0.0.5 Router5-1
141 5.5.5.2 0.0.0.5 Router5-2
我想将其重塑为2行数据框,例如:
我一直在使用stack/unstack
和pivot
功能,但走得不远。
例如,dfAbr1 = pd.DataFrame(dfAbr.set_index('ospfArea').stack()).reset_index()
重命名列名称,将产生以下内容:
In [151]: dfAbr1
Out[151]:
ospfArea level1 level2
0 0.0.0.2 ip 1.1.1.1
1 0.0.0.2 router_name Router1-1
2 0.0.0.2 ip 1.1.1.2
3 0.0.0.2 router_name Router1-2
4 0.0.0.5 ip 5.5.5.1
5 0.0.0.5 router_name Router5-1
6 0.0.0.5 ip 5.5.5.2
7 0.0.0.5 router_name Router5-2
[从那里,我想pivot
,就像这样:dfAbr1.pivot(index='ospfArea', columns='level1',values='level2')
,但是当我得到Index contains duplicate entries, cannot reshape
时就不会这么做。我相信这是因为在level1
下,我有重复的值...
还有其他方法吗?
谢谢!
通过MultiIndex
通过DataFrame.set_index
创建DataFrame.set_index
,通过GroupBy.cumcount
创建计数器,通过GroupBy.cumcount
重塑形状,并通过DataFrame.unstack
通过DataFrame.unstack
将Multiindex
展平:
map
具有枢轴的解决方案,另请参阅format
df = df.set_index(['ospfArea', df.groupby('ospfArea').cumcount().add(1)]).unstack()
df.columns = df.columns.map('{0[0]}{0[1]}'.format)
print (df)
ip1 ip2 router_name1 router_name2
ospfArea
0.0.0.2 1.1.1.1 1.1.1.2 Router1-1 Router1-2
0.0.0.5 5.5.5.1 5.5.5.2 Router5-1 Router5-2
输出:
this question