使用 pd.cut 处理重复的 bin 和标签

问题描述 投票:0回答:1

我将

pd.cut
与关键字参数
duplicates='drop'
一起使用。但是,当您将其与关键字参数
labels
结合使用时,这会产生错误。

这个问题与this问题类似,但忽略了标签部分。

不起作用:

pd.cut(pd.Series([0, 1, 2, 3, 4, 5]), bins=[0, 1, 1, 2])

作品:

pd.cut(pd.Series([0, 1, 2, 3, 4, 5]), bins=[0, 1, 1, 2], duplicates='drop')

不起作用:

pd.cut(pd.Series([0, 1, 2, 3, 4, 5]), bins=[0, 1, 1, 2], duplicates='drop', labels=[0, 1, 1, 2])

我们难道不希望它删除与重复条目对应的标签吗?

python pandas
1个回答
0
投票

不,

cut
文档非常清楚,它只涉及bins

重复 {默认‘raise’, ‘drop’},可选

如果 bin 边不唯一,则引发 ValueError 或丢弃非唯一值。

此外,在任何情况下,标签都必须比 bin 多一个值,因此根据 bin 删除标签将是不明确的。

© www.soinside.com 2019 - 2024. All rights reserved.