我是python的新手并且正在进行字符串操作
我有一个数据帧
df['Installs']
Out[22]:
0 10,000+
1 500,000+
2 5,000,000+
3 50,000,000+
4 100,000+
5 50,000+
如何删除“+”并将df中的字符串转换为float?
我的意见:
df ['Installs'] = df ['Installs']。str.replace('+','',regex = True).astype(float)
但是我收到一个错误:
ValueError: could not convert string to float: '10,000'
如何编辑我的代码,以便获得10,000.0作为输出,依此类推其他值而不是10,000+
使用Series.str.replace
与,
和+
清空string
:
df['Installs'] = df['Installs'].str.replace('[,+]','').astype(float)
#alternative
#df['Installs'] = df['Installs'].replace('[,+]','', regex=True).astype(float)
print (df)
Installs
0 10000.0
1 500000.0
2 5000000.0
3 50000000.0
4 100000.0
5 50000.0