用于循环以计算熊猫子类别列中每个不同值的desc统计信息

问题描述 投票:0回答:1

我想为我的数据集的“子类别”列中的每个不同值计算“方差”列的描述统计量。我想使用一个for循环,而不是手动执行。我遇到值错误,但不确定我可能会丢失什么。谢谢!

subcategories = ['abc', 'cab', 'bac', 'cde', 'edc', 'fgh', 'ghb']

for i in subcategories:
    if df[df.Subcategory == i]:
        print(df['Variance'].describe())

运行代码时,出现以下值错误:

ValueError: The truth value of a DataFrame is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or 
a.all()
python-3.x pandas
1个回答
1
投票

df.Subcategory == i返回布尔序列。 if条件不知道如何返回序列。您需要这个:

for i in subcategories:
    print(df.loc[df.Subcategory == i, 'Variance'].describe())
© www.soinside.com 2019 - 2024. All rights reserved.