请注意,当你输入pandas.cut成数据帧,你会得到每一个元素,名称:,长度:,D型:和分类输出的垃圾箱。我只想类别阵列打印的我,所以我能获得垃圾桶我一直在寻找的数量只是范围。例如,对于二进制位= 4输入到数字的数据帧“1,2,3,4,5”,我希望的输出打印仅四个仓2],(2的范围内,即,(1,, 3],(3,4],(4,5]。
有反正我能做到这一点?它可以是任何东西,即使它不需要打印“类别”。
我猜你只是想从pd.cut()
得到“垃圾桶”。如果是这样,你可以简单地设置retbins=True
,见the doc of pd.cut
例如:
在[01]:
data = pd.DataFrame({'a': [1, 2, 3, 4, 5]})
cats, bins = pd.cut(data.a, 4, retbins=True)
出[01]:
cats
:
0 (0.996, 2.0]
1 (0.996, 2.0]
2 (2.0, 3.0]
3 (3.0, 4.0]
4 (4.0, 5.0]
Name: a, dtype: category
Categories (4, interval[float64]): [(0.996, 2.0] < (2.0, 3.0] < (3.0, 4.0] < (4.0, 5.0]]
bins
:
array([0.996, 2. , 3. , 4. , 5. ])
然后你就可以重用bins
为你高兴。例如。,
lst = [1, 2, 3]
category = pd.cut(lst,bins)