使用此函数 groupby().mean

问题描述 投票:0回答:1

将 pandas 导入为 pd

假设 df 是我的 DataFrame

数据={ '品牌': ['丰田', '本田', '丰田', '宝马', '日产', '丰田', '本田', '本田', '丰田', '日产'], '颜色': ['白色', '红色', '蓝色', '黑色', '白色', '绿色', '蓝色', '蓝色', '白色', '白色'], '里程表(公里)': [150043, 87899, 32549, 11179, 213095, 99213, 45698, 54738, 60000, 31600], '门': [4, 4, 3, 5, 4, 4, 4, 4, 4, 4], '价格': ['$4,000.00', '$5,000.00', '$7,000.00', '$22,000.00', '$3,500.00', '$4,500.00', '$7,500.00', '$7,000.00', '$6,250.00', “$9,700.00”] }

df = pd.DataFrame(数据)

按“Make”分组并计算每个数字列的平均值

结果 = df.groupby("Make").mean()

显示结果

打印(结果)

''' 这是我的代码,这段代码没有错误,因为它遵循 pandas 文档并遵循所有规则,但它仍然给出错误,如果我给出任何“char”,那么它工作正常,并给出正确的答案,如下面的代码“一切在 jupyter 笔记本中测试” '''

将 pandas 导入为 pd

假设 df 是我的 DataFrame

数据={ '品牌': ['丰田', '本田', '丰田', '宝马', '日产', '丰田', '本田', '本田', '丰田', '日产'], '颜色': ['白色', '红色', '蓝色', '黑色', '白色', '绿色', '蓝色', '蓝色', '白色', '白色'], '里程表(公里)': [150043, 87899, 32549, 11179, 213095, 99213, 45698, 54738, 60000, 31600], '门': [4, 4, 3, 5, 4, 4, 4, 4, 4, 4], '价格': ['$4,000.00', '$5,000.00', '$7,000.00', '$22,000.00', '$3,500.00', '$4,500.00', '$7,500.00', '$7,000.00', '$6,250.00', “$9,700.00”] }

df = pd.DataFrame(数据)

按“Make”分组并计算每个数字列的平均值

结果 = df.groupby("Make").mean('dhshsdhs')

显示结果

打印(结果)

''' 这段代码如何正常工作? '''

我尝试了 pandas 文档中提到的正确编码方式,但出现错误,当以错误方式编写代码时,它给出了正确的结果。

pandas dataframe group-by jupyter-notebook jupyter-irkernel
1个回答
0
投票

groupby.mean
接受
numeric_only
参数,默认为
False

这就是触发错误的原因,因为

'$4,000.00'
中包含字符串
Price
而不是数字。

通过传递随机字符串作为参数,您只需设置

numeric_only=True

© www.soinside.com 2019 - 2024. All rights reserved.