我正在查看UCI成人数据框(https://archive.ics.uci.edu/ml/machine-learning-databases/adult/adult.data)。我想输出和计算所有行,其中原生国家是'德国'。以下代码:
df[df['native-country']=="Germany"]
我说所有的行都是False
。有没有其他方法来计算行数和/或打印出来? Dummie可能不是一种选择,因为数据框中有20多个不同的国家。
我认为你在国家领域有空白
尝试
df[df['native-country']==" Germany"]
要么
df[df['native-country'].str.contains("Germany")]
您的命令df[df['native-country']=="Germany"]
应该只打印符合条件的行。如果你看到False
值的行,你可能实际上正在执行df['native-country']=="Germany"
,它返回True
和False
的布尔掩码。
要计算native-country
列中每个唯一值的出现次数,请尝试:
df['native-country'].value_counts()