我希望那些出现在数据框中的客户具有比真实值更多的假值。有关如何实现此目标的任何建议

问题描述 投票:0回答:2

数据框:

df = pd.DataFrame({'A': ['cust1', 'cust1', 'cust2', 'cust1',
                            'cust2', 'cust1', 'cust2', 'cust2','cust2','cust1'],
                       'B': ['true', 'true', 'true', 'false',
                            'false', 'false', 'false', 'true','false','true']})

输出:['cust2']

pandas dataframe solution
2个回答
0
投票

首先通过crosstab获取计数,然后通过具有crosstab的列过滤index值,使用更大的boolean indexing

boolean indexing

0
投票
Series.gt

说明:仅使用“ False”,“ A”分组并计数的所有值。现在按降序对值进行排序,并获得第一个index('A')值。

© www.soinside.com 2019 - 2024. All rights reserved.