group-by 相关问题

GROUP BY是SQL关系数据库标准中的一个命令,用于将共享字段值的一组行折叠为单个行。可以在组中的其他字段(例如SUM()或AVG())上执行聚合函数,以将相关数据整理为单个值。

利用循环或自动化方法而不是手动输入每个 iloc 位置来更改数据帧值

总结:我希望能够重新创建我的函数,而不必手动输入每个单独的 iloc 并使用 if/elif 来实现当组太大而无法处理的情况下的可扩展性 ...

回答 1 投票 0

如何将索引设置为 pandas 中的分组值?

我尝试按照这里的示例进行我认为应该有效的操作。我想获取按“大陆”分组的所有数据,然后将其设置为我的索引。我尝试对数据进行分组: 继续...

回答 1 投票 0

根据今天的相对增量获取活动计数

我有一个如下所示的数据框,大约一百万行具有唯一的 person_id +------------+------------+----------+ |人名 |日期 |活动 | +------------+------------+----------+ |一个...

回答 1 投票 0

跨组最大

我有以下数据: 日期、符号、收盘价 2021-01-01, 苹果, 10 2021-01-02, 苹果, 12 2021-01-03, 苹果, 3 2021-01-01,微软金融时报,12 2021-01-02,微软金融时报,20 2021-01-03,微软金融时报,12 2021-01-01, 微软金融时报, 1 2021-...

回答 1 投票 0

根据 groupby python 产生的条件返回数据帧的子集

我有一个如下所示的数据框: 日期|地点|代理 2023-10-02|A|代理1 2023-10-02|A|代理2 2023-10-05|B|代理3 2023-10-05|B|代理2 2023-10-02|C|代理1 2023-10-02|C|代理2 2023-10-02|C|代理3 开

回答 1 投票 0

如何使用pandas groupby创建字典?

我有一个数据框,其中包含不同患者组中每个人的多个变量的值。例如,我有患者组中多个个体的年龄、性别、体重等,例如,

回答 2 投票 0

在 PostgreSQL 中创建视图

我在表A中有以下列,记录用户每次从建筑物签入或签出时的指纹“交易”。 创建表 user_transactions ( id 序列号 P...

回答 2 投票 0

Postgresql 创建视图

我在表A中有以下列,记录用户每次从建筑物签入或签出时的指纹“交易”。 创建表 user_transactions( id 序列 PRIMARY K...

回答 2 投票 0

Pandas Groupby - 运行自函数 - 然后转换(应用)

我需要对每组进行回归,然后将系数传递到新的列 b 中。这是我的代码: 自定义函数: def simplereg(g, y, x): 尝试: xvar = sm.add_constant(g[...

回答 1 投票 0

pandas 数据帧对连续重复项进行分组并对值求和

在 pandas 数据框中,我完全困惑如何使用 groupby() 方法对列中的总和值进行连续重复 假设我有以下 DataFrame df : 索引类型 val...

回答 1 投票 0

将任意函数应用于 Pandas 数据框 groupby

如何将任意函数按组应用于 Pandas 数据框?该函数应该能够立即访问整个组 df ,就像它是一个完整的 pandas 数据帧一样。 将 pandas 导入为 pd 定义

回答 1 投票 0

按列对数据进行分组,并检查各组中指定列的内容是否相同

我有一个数据表如下: 示例_数据 <- data.table( group_number = c(1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 4, 4, 4, 4), A = c(1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 4), B = c(...

回答 1 投票 0

使用更简单(矢量化?)操作而不是循环来聚合数据帧

我有一段代码可以正确工作(给出预期的答案),但效率低下且不必要地复杂。它使用我想简化并提高效率的循环,可能你...

回答 1 投票 0

如何获取每个国家一年内随时间变化的不同观察结果的平均值?非数值问题

我正在对一段时间内的议会数据进行分析,涉及特定年份议会中女性的百分比。多年来,由于 w 的百分比,存在多次观察结果...

回答 1 投票 0

在 pandas DataFrame 中查找每个组的模式

我有一个包含以下 3 列的数据框:属性、值、计数 (属性、值)对是唯一的。 我需要向该数据框添加一个新列,这将检查 count 中的值是否...

回答 1 投票 0

如何向 pandas 中的数据框行添加列表? [重复]

在以下代码中,formation_top变量具有地层名称及其顶部深度: formation_top = pd.DataFrame('Formation': ['Balakhany', 'Balakhany X', 'Pereriv A', 'Pereviv B'],'部门...

回答 1 投票 0

在 pandas 中为 groupby 分配数字序列

在新列中创建一个序列,该序列按 tag_id 和 sub_id 分组,并按 tag_id 和 logdate 升序排序数据帧。预期输出如下图所示。 dfx = pd.DataFrame({'tag_id': [...

回答 1 投票 0

统计按备注分组的记录数

如何统计每条评论的记录数?每个备注在备注列值内都有不同的编号。我需要根据备注内容而不是 cid### 对记录进行分组。需要按

回答 2 投票 0

groupy 上的 Dask Dataframe 模式?

我正在尝试在dask数据帧中的groupby聚合下提取一系列的“模式”。我可以找到模式的文档,但找不到如何在分组下使用它。 导入熊猫...

回答 1 投票 0


© www.soinside.com 2019 - 2024. All rights reserved.