在DataFrame中选择准确的值

问题描述 投票:1回答:2

我正在查看UCI成人数据框(https://archive.ics.uci.edu/ml/machine-learning-databases/adult/adult.data)。我想输出和计算所有行,其中原生国家是'德国'。以下代码:

df[df['native-country']=="Germany"]

我说所有的行都是False。有没有其他方法来计算行数和/或打印出来? Dummie可能不是一种选择,因为数据框中有20多个不同的国家。

python-3.x pandas dataframe
2个回答
3
投票

我认为你在国家领域有空白

尝试

df[df['native-country']==" Germany"]

要么

df[df['native-country'].str.contains("Germany")]

1
投票

您的命令df[df['native-country']=="Germany"]应该只打印符合条件的行。如果你看到False值的行,你可能实际上正在执行df['native-country']=="Germany",它返回TrueFalse的布尔掩码。

要计算native-country列中每个唯一值的出现次数,请尝试:

df['native-country'].value_counts()
© www.soinside.com 2019 - 2024. All rights reserved.