group-by 相关问题

GROUP BY是SQL关系数据库标准中的一个命令,用于将共享字段值的一组行折叠为单个行。可以在组中的其他字段(例如SUM()或AVG())上执行聚合函数,以将相关数据整理为单个值。

跨组顺序编号,无需在 r 中重新启动序列[重复]

我想在示例数据框中创建“转向”列。我有一个包含数千行的更大数据集。该列将指示扬声器当前的轮次。即使被判刑...

回答 1 投票 0

通过两个 lambda 条件过滤组并根据条件创建新列的最佳方法是什么?

这是我的数据框: 将 pandas 导入为 pd df = pd.DataFrame( { 'a': ['x', 'x', 'x', 'x', 'y', 'y', 'y', 'y', 'z', 'z', 'z', ' p', 'p', 'p', 'p'], 'b': [1, -1, 1, 1, -1, 1, 1, -1...

回答 1 投票 0

此 Postgresql ROLLUP 分组不适用于 Window 表达式

以下 SQL 运行良好;它为我提供了我想要的计数和百分比结果:(请在需要时使用 EXTRACT (YEAR|MONTH|DAY ...) ): 选择年份(evt_date)AS 年,月(evt_date)AS ...

回答 1 投票 0

检查 pandas 组特定列中的所有记录组成预定义的预期值列表

我有一个数据框,我需要检查每个组是否包含例外值的完整补充。 我尝试过按患者 ID 进行分组并使用转换来检查每个组是否拥有全部 6 个

回答 1 投票 0

如何计算数据透视表中多列的总和? [重复]

我有这张旋转桌子。 SCORE 无信息正确 not_ Correct 时间 2023-03-31 3 5 6 2023-04-30 ...

回答 1 投票 0

BigQuery SQL:按唯一 ID 分组时有条件地计算列值(如果列表中恰好存在 2/3 代码)

假设我有以下示例输入表: |身份证 |代码| |------|------| | 1234 | 1234 121A | 121A | 1234 | 1234 334B | 334B | 1234 | 1234 543A | 543A | 1112 | 1112 121A | 121A | 1112 | 1112 333B | 333B | 2234 | 2234 121A | 121A | 2234 | 2234 301B | 301B | ...

回答 1 投票 0

BigQuery SQL:按唯一 ID 分组时有条件地计算列值(如果列表中仅存在一个代码)

假设我有以下示例输入表: ID 代码 1234 323F 1234 327F 1234 328F 1234 333F 2234 327F 2234 342F 3314 327F 3314 357F 我想创建一个名为“Count...

回答 1 投票 0

Pandas 分组后日期的滚动平均值

df = pd.DataFrame( {“日期”:[pd.Timestamp(“2022-01-01”),pd.Timestamp(“2022-01-01”),pd.Timestamp(“2022-01-01”),pd.Timestamp(“ 2022-01-03"), pd.

回答 2 投票 0

如何找到每年事件的中位数?熊猫按数据科学问题分组

我有一个数据集,其中每一行都是一个恐怖主义事件,我想找到每个国家/地区单位中每次袭击造成的死亡人数中位数。在 df1 中,每一行都是恐怖主义事件,其中

回答 1 投票 0

2列日期之间最接近的日期,生成新列

我有这个玩具数据集: df = pd.DataFrame({'用户':[1,1,1,2,2,2,2,3,3,3,3,4,4,4,4,4], 'd1':['1995-09-01','1995-09-02','1995-10-03','1995-10-04','1995-10-05','1995-11- 07','1995-11-0...

回答 1 投票 0

Pandas 对分类变量的滚动函数

我有一个像这样的pandas数据框 群猫 1 0 2 0 1 0 1 1 2 0 2 1 1 2 1 2 我正在尝试按组对数据进行分组,然后将自定义函数应用于过去 5 r...

回答 1 投票 0

跨两个数据帧收集非索引列上的公共组

这里有两个数据框,按照我想要的方式分组: last5s = pd.Timestamp.now().replace(微秒=0) - pd.Timedelta('5s') 日期 = pd.date_range(last5s, period = 5, freq='s') N=10 数据1 = np.随机。

回答 1 投票 0

Pandas groupby 使用多索引为数据帧产生意外结果

我有一个 pandas.DataFrame ,其 Multiindex 有 3 个级别。我想按前两个级别进行分组,并将最大值保留在第三个级别。 pandas.groupby 产生意想不到的结果。我是

回答 1 投票 0

按总月数拆分预算列,得出平均每月预算

我正在尝试创建一个新列,其中包含基于广告系列持续时间的平均每月预算 我当前的数据集如下所示 客户 开始日期 结束日期 活动 总预算 ABC...

回答 1 投票 0

在 javascript 中折叠属性值上的对象数组

如何在对象属性上聚合对象数组以便转动: [ { key: 'black', value: [ '2', '3', '9' ] }, { 键:'黑色',值:['1']}, { key: 'gold', value: [ '2', '3' ]...

回答 6 投票 0

Groupby:获取最大值并保持所有列相关

我有一个数据框如下: 对于每一列 objectid,我试图保留列 pct 最大的行。 我做了一个groupby,如下所示: df.groupby(['objectid'])['pct'].max().reset_i...

回答 1 投票 0

如何在sql中返回12个月?

我用这个sql画了一个图表: SELECT ljj.job_id, 总和(CASE 当 ljj.job_type = "0" 那么 1 其他 0 结束)AS 工作数量,...

回答 2 投票 0

从固定时间开始以分钟为单位进行分组,无论第一行时间如何

我有这段代码,旨在计算 30 分钟间隔内发生的次数;要求是在固定的起点(每小时的 00 分钟和 30 分钟)设置这些间隔。遗憾的是,尽管

回答 1 投票 0

如何在我的一组数据集中执行ANCOVA?

我无法找出使用 ANCOVA 执行亚组分析的适当方法。为了进行分析,我想比较两组之间 6 个月的抑郁评分 (six_PHQ):干预...

回答 1 投票 0

极坐标分组+ value_counts

我需要一些有关极坐标的帮助: 我有一个带有分类值列的数据框 ┌────────────────────┬──────────────┬────────┐ │ session_id ┆ elapsed_time ┆ fqid │ │ --- ┆ -...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.