我是 Pandas 新手,我正在尝试更好地理解 numeric_only 参数的用法。
正如您在下面的屏幕截图中看到的,目标是根据作者的禁令状态来拉动视频分享的中位数。为什么我需要在中值函数中指定“numeric_only = True”。为什么当我删除 numeric_only 参数时,结果会拉取数据框的多个字段?
我希望仅使用中位数(['video_share_count'])就足以指定我只对提取特定的数字字段感兴趣。
“为什么当我删除 numeric_only 参数时,结果会拉取数据框的多个字段?”
通过运行:
df.groupby('author_ban_status').median(['video_share_count'])
你实际上还在使用
numeric_only
参数,它相当于:
df.groupby('author_ban_status').median(numeric_only=['video_share_count'])
由于
bool(['video_share_count'])
的计算结果为 True
,你实际上是在运行:
df.groupby('author_ban_status').median(numeric_only=True)