将 pandas 导入为 pd
数据={ '品牌': ['丰田', '本田', '丰田', '宝马', '日产', '丰田', '本田', '本田', '丰田', '日产'], '颜色': ['白色', '红色', '蓝色', '黑色', '白色', '绿色', '蓝色', '蓝色', '白色', '白色'], '里程表(公里)': [150043, 87899, 32549, 11179, 213095, 99213, 45698, 54738, 60000, 31600], '门': [4, 4, 3, 5, 4, 4, 4, 4, 4, 4], '价格': ['$4,000.00', '$5,000.00', '$7,000.00', '$22,000.00', '$3,500.00', '$4,500.00', '$7,500.00', '$7,000.00', '$6,250.00', “$9,700.00”] }
df = pd.DataFrame(数据)
结果 = df.groupby("Make").mean()
打印(结果)
''' 这是我的代码,这段代码没有错误,因为它遵循 pandas 文档并遵循所有规则,但它仍然给出错误,如果我给出任何“char”,那么它工作正常,并给出正确的答案,如下面的代码“一切在 jupyter 笔记本中测试” '''
将 pandas 导入为 pd
数据={ '品牌': ['丰田', '本田', '丰田', '宝马', '日产', '丰田', '本田', '本田', '丰田', '日产'], '颜色': ['白色', '红色', '蓝色', '黑色', '白色', '绿色', '蓝色', '蓝色', '白色', '白色'], '里程表(公里)': [150043, 87899, 32549, 11179, 213095, 99213, 45698, 54738, 60000, 31600], '门': [4, 4, 3, 5, 4, 4, 4, 4, 4, 4], '价格': ['$4,000.00', '$5,000.00', '$7,000.00', '$22,000.00', '$3,500.00', '$4,500.00', '$7,500.00', '$7,000.00', '$6,250.00', “$9,700.00”] }
df = pd.DataFrame(数据)
结果 = df.groupby("Make").mean('dhshsdhs')
打印(结果)
''' 这段代码如何正常工作? '''
我尝试了 pandas 文档中提到的正确编码方式,但出现错误,当以错误方式编写代码时,它给出了正确的结果。
groupby.mean
接受 numeric_only
参数,默认为 False
。
这就是触发错误的原因,因为
'$4,000.00'
中包含字符串 Price
而不是数字。
通过传递随机字符串作为参数,您只需设置
numeric_only=True