pandas-groupby 相关问题

用于根据给定条件将变量分组在一起。并且仅用于与“pandas”库相关

计算 Python Pandas 中数据帧的平均值

我有一个数据框列表。每个数据帧最初都是数字数据,其形状均相同,有 21 行和 5 列。第一列是索引(索引 0 到索引 20)。我

回答 3 投票 0

如何计算每组的移位扩展平均值

我希望基于 groupby('col1') 扩展 col2 的平均值,但我希望平均值不包含行本身(仅包含其上方的行) dummy = pd.DataFrame({"col1": ["a",'a','a','b','b','b','c','c'],"...

回答 2 投票 0

使用 Grouper 的 pandas 系列日期时间索引中的月份名称

我正在将一年的数据(六月至五月)按月绘制成胡须箱图。 我有 pandas 系列的数据: 日期 2018-06-01 0.012997 2018-06-02 0.009615 2018-06-03 0.012884 2018-06-04 ...

回答 2 投票 0

pandas dataframe groupby:应用涉及分组索引值的函数

让我用这个简单的 df 作为例子。 df = pd.DataFrame([[1,1,10],[1,1,30],[1,2,40],[2,3,50],[2,3,150],[2,4,100] ],列=["col_grp","col1","col2"]) col_grp col1 ...

回答 2 投票 0

将 pandas 中的 groupby() 分成更小的组并将它们组合

城市气温风速事件 天 2017-01-01 纽约 32 6 雨 2017-01-02 新你...

回答 3 投票 0

如何在pandas中定义自定义财务季度?

我有一个数据框,如下所示 df = pd.DataFrame( {'螺柱_id':[101, 101, 101, 101, 101, 101, 101, 101], 'ques_date' : ['13/11/2020', '10/1/2018', '11/11/2017', '27/03/20...

回答 2 投票 0

使用 pandas 滚动的滑动窗口迭代器

如果是单行,我可以得到迭代器如下 将 pandas 导入为 pd 将 numpy 导入为 np a = np.zeros((100,40)) X = pd.DataFrame(a) 对于 X.iterrows() 中的索引、行: 打印索引 原则...

回答 3 投票 0

Pandas 上的 SQL“GROUP BY HAVING”相当于什么?

在 pandas 中使用 groupby 并并行应用过滤器的最有效方法是什么? 基本上我要求 SQL 中的等效项 选择 * ... 按列名分组 有条件 我...

回答 3 投票 0

如何使用groupby+transform代替pipe?

假设我有一个像这样的数据框 将 pandas 导入为 pd 从 scipy 导入统计数据 df = pd.DataFrame( { '组':列表('abaab'), 'val1':范围(5), 'val2': 范围(2, 7), ...

回答 2 投票 0

Pandas:某个值相对于组总数的百分比

我有一个包含产品列表销售数量的数据框。每个产品都分配有一个设计/系列名称。每个设计中可能有多个产品。我如何执行计算...

回答 2 投票 0

Pandas DF 到 Xarray 数据集

嗨,最初我的 Xarray 数据集如下: 维度:(纬度:721,经度:1400,时间:71) 坐标: * 时间 (time) datetime64[ns] 2000-12-31 2001-1...

回答 1 投票 0

pandas groupby 计算列中零的数量

我有一个数据框,例如: 日期 B C 2018年7月20日 10 8 2018年7月20日 1 0 21.07.2018 0 1 2018年7月21日 1 0 我怎样才能...

回答 3 投票 0

Pandas JSON_仅对特定列进行标准化

我有一个嵌套的 JSON 结构,我需要将其展平。使用 JSON 标准化时,它会展平所有键。但是,我想展平特定的键,同时保留嵌套的其他键。如何实现...

回答 2 投票 0

如何在多个groupby之后将pandas数据从索引移动到列

我有以下熊猫数据框: 象征年使用书籍 386 黄素 1830 3 3 387 黄素 1840 1 1 388 黄素 1840 2 2 第389章 黄花 1868 2 ...

回答 4 投票 0

Pandas Dataframe Timedelta Mean() 未显示正确的值

我搜索了又搜索,但没有找到解决方案或只是找到为什么会发生这种情况的答案。 我正在尝试确定 pandas 数据框中 Request_Closing_Time 的每个行政区的平均值()。 ...

回答 2 投票 0

如何使用groupby并应用polars

我正在绞尽脑汁地试图弄清楚如何使用 groupby 并在 Python 的 Polars 库中应用。 来自 Pandas,我使用的是: def get_score(df): return Spearmanr(df["预测"...

回答 1 投票 0

pandas:使用 numba 进行 groupby 应用

使用pandas v1.1.0。 在 pandas 文档中,有一个关于如何使用 numba 加速 moving.apply() 操作的很好的示例。 将 pandas 导入为 pd 将 numpy 导入为 np def mad(x): 返回 np.fa...

回答 3 投票 0

pandas groupby fill bfill 需要中间groupby?

我试图通过对一列进行分组,然后对组内的列子集进行洪水填充(bfill().ffill())来掩盖数据框中丢失的数据。 我以前使用过 def ffbf(x):

回答 2 投票 0

pandas 分组同时添加和平均[重复]

我有一个数据框,其中包含进程列表及其花费的时间,如下所示 我想得到以下结果 我知道如何使用 gorupby 来获得一列,但只有其中一列......

回答 2 投票 0

如何获取多列分组中的第一组?

我一直在尝试弄清楚如何在应用groupby后仅返回第一组。 我的代码如下所示: gb = df.groupby(['col1', 'col2', 'col3', 'col4'])['col5'].sum() 我想要什么...

回答 4 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.