我希望那些出现在数据框中的客户具有比真实值更多的假值。有关如何实现此目标的任何建议

Question

数据框：

df = pd.DataFrame({'A': ['cust1', 'cust1', 'cust2', 'cust1',
                            'cust2', 'cust1', 'cust2', 'cust2','cust2','cust1'],
                       'B': ['true', 'true', 'true', 'false',
                            'false', 'false', 'false', 'true','false','true']})

输出：['cust2']

Answer 1

首先通过crosstab获取计数，然后通过具有crosstab的列过滤index值，使用更大的boolean indexing：

boolean indexing

Answer 2

Series.gt

说明：仅使用“ False”，“ A”分组并计数的所有值。现在按降序对值进行排序，并获得第一个index（'A'）值。

我希望那些出现在数据框中的客户具有比真实值更多的假值。有关如何实现此目标的任何建议

问题描述投票：0回答：2

2个回答

最新问题

我希望那些出现在数据框中的客户具有比真实值更多的假值。有关如何实现此目标的任何建议

问题描述 投票：0回答：2

2个回答

最新问题

问题描述投票：0回答：2