我想为我的数据集的“子类别”列中的每个不同值计算“方差”列的描述统计量。我想使用一个for循环,而不是手动执行。我遇到值错误,但不确定我可能会丢失什么。谢谢!
subcategories = ['abc', 'cab', 'bac', 'cde', 'edc', 'fgh', 'ghb']
for i in subcategories:
if df[df.Subcategory == i]:
print(df['Variance'].describe())
运行代码时,出现以下值错误:
ValueError: The truth value of a DataFrame is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or
a.all()
df.Subcategory == i
返回布尔序列。 if条件不知道如何返回序列。您需要这个:
for i in subcategories:
print(df.loc[df.Subcategory == i, 'Variance'].describe())