df= pd.DataFrame({'days': [0,31,45,35,19,70,80 ]})
df['range'] = pd.cut(df.days, [0,30,60])
df
这里复制了代码,其中pd.cut用于将数字列转换为分类列。 pd.cut
通常根据通过[0,30,60]
的列表给出类别。在此行的0,5和6中,将其归类为Nan,该值超出[0,30,60]
。我想要的分别是0 should categorized as <0
和70 should categorized as >60
以及类似的80 should categorized as >60
,如果可能,根据创建的类别编号,动态标记A,B,C,D,E
的文字。
在第一部分中,将-np.inf
和np.inf
添加到垃圾箱将确保所有内容都成为垃圾箱: