我正试图清理我的数据以进行一些分析。我的数据 (.csv
)是一些实验的输出,所以每一列都重复着相同的格式或文字。我为我的原始数据添加了一个图像。在我的四列中,每列都有:。
df = pd.DataFrame({'rev45s':['Area is 389.62 km^2','aspArea is 76.61 km^2','asp_Ave_slip is 1.59 m','Mw is 5.5'],
'rev45':['Area is 589.32 km^2','aspArea is 66.65 km^2','asp_Ave_slip is 3.69 m','Mw is 6.1'],
'SS45':['Area is 319.62 km^2','aspArea is 61.71 km^2','asp_Ave_slip is 3.09 m','Mw is 6.8'],
'SS45s':['Area is 489.52 km^2','aspArea is 54.61 km^2','asp_Ave_slip is 1.44 m','Mw is 9.5']})
我需要做一个新的 Dataframe
与
第一列为 "参数"=(Area, aspArea, asp_Ave_slip, Mw )
第二列到第四列分别为 "rev45s_value"、"rev45_value"、"SS45_value"、"SS45s_value "和 "rev45s_value"。
第五栏为 "单位"=(km^2,km^2,m,-)
我尝试了一些代码,比如
df['rev45s']=df['rev45s'].apply(lambda x: pd.Series(x.split()))
和
df['rev45s']=df['rev45s'].str.split(' ')
但他们没有工作。如何清理这个DataFrame?