group-by 相关问题

GROUP BY是SQL关系数据库标准中的一个命令,用于将共享字段值的一组行折叠为单个行。可以在组中的其他字段(例如SUM()或AVG())上执行聚合函数,以将相关数据整理为单个值。

更新 pandas 数据框中每个子组内的所有值

我有一个 pandas 数据框,其中有 4 列注释、ID、日期、PRIMARY_INDICATOR、PHONE 每个 ID 在表中可以有多行。这些行保证按日期降序排序...

回答 1 投票 0

SQL 按年份分组

这是我的疑问。 选择转换(varchar,强制转换(日期为日期时间),3) FROM 店铺转让 按年份(日期)分组 我想按日期(varchar)列的年份部分进行分组,但是我得到以下结果...

回答 6 投票 0

如何计算滚动窗口,然后groupby,然后聚合而不循环?

我有一个 pandas 数据框更新如下: 流,低,高 时间 2023-01-10 16:07:36.264,979,1.07331,1.07344 2023-01-10 16:07:36.359,1009,1.07331,1.07338 2023-01-10 16:0...

回答 1 投票 0

返回所有重复行

我编写了这段代码来查找重复项,它工作得很好: 选择 * 来自样式表 按颜色分组 计数(*) > 1 问题是,它只返回重复行之一。是吗

回答 4 投票 0

在函数参数中自定义 for 循环(在 Python 中)

我的同事写了8个类似的函数,用于在过滤后执行操作。举个例子,一个函数就像 def operation_at_country_kind_level(df): #还有其他国家...

回答 1 投票 0

如何根据组内另一列值比较的标准向前填充 pandas 列

我有两个分组列(患者、遭遇)、一个时间戳列和一个变量列(值),我想转发填充。 我只想转发组中一行中的填充值,如果时间

回答 1 投票 0

如何配对并创建新的 DF

我有这个 df,其中存在 2 艘船的 mmsi 及其坐标以及日期时间。 我正在尝试创建一个新的 df ,其中第一列是对 对 开始时间 时间结束 自己的坐标

回答 1 投票 0

在Pandas中使用group by后如何添加列或更改每组中的数据?

我现在使用 Pandas 来处理一些数据。我在pandas中使用group by后,简化后的DataFrame的格式是[MMSI(Vessel_ID), BaseTime, Location, Speed, Course,...]。 我用 对于 MMSI,在

回答 1 投票 0

如何修改我的having子句,以便我的查询将显示我想要的结果

所以目前我的查询显示了基于该大陆的国家/地区的所有“首选”旅行目的地的结果,并且我添加了一个having子句来显示拥有更多...

回答 1 投票 0

计算另一个数据帧中一个数据帧中的值

假设我有一个像这样的数据框: df <- data.frame( D = c('A', 'B', 'C'), Q = c('asd', 'reg', 'rt'), id = I(list(c(124, 532, 78), c(1, 3, 532), c(2, 3, 78, 124, 1))) ) and another one ...

回答 1 投票 0

在dplyr中编写group_by/summarise的代码更简洁?

我有一个数据框,称之为“df”,其中包含过去 5 年中约 250 只命名个体鸟类的所有检测结果,约 11000 行。 df 具有 DATE、BIRD、YEAR、MONTH、DAY 和

回答 2 投票 0

将连接表的结果限制为一行

这是一个简化的表结构: 表产品( Product_id INT(主键,自动增量), 类别_id INT, 产品标题 VARCHAR, ETC ); 表产品照片( 产品照片 ID(p...

回答 4 投票 0

我无法在查询中组合相邻的时间段

我在 PostgreSQL 工作。 我有一个表,用于存储有关客户及其在不同组中的状态的信息。我想要一个选择查询来显示这些信息,例如句点而不是事件结构...

回答 1 投票 0

如何根据行是否满足条件将函数应用于数据框组?

我正在尝试按用户对 df 进行分组,并使用以下规则对该用户的每次出现应用权重。 如果用户在 df 中出现 3 次或更多次,我要分配: 重量为 0.4 ...

回答 1 投票 0

过去 24 个月的记录 - 按月需要从 SQL Server 获取

我有一个员工表,我需要从指定月份开始按月获取过去两年的员工总数。 桌子设计 +------------+-------------+ |领域 | ...

回答 1 投票 0

给定一个包含 3 列的数据框,对于每对不同的“A”和“B”,返回“C”的所有唯一值的列表

我有以下数据框: 富巴巴兹 0 1234_312_GCD 1234 312 1 1234_312_GCD 1234 312 2 1234_312_GCD 1234 312 3 1234_312_GCD 1234 ...

回答 1 投票 0

不带GROUP BY的聚合查询

这个查询似乎在我的旧机器上完美运行。但是,在我的 MySQL 5.7.14 和 PHP 5.6.25 的新机器上,它会抛出错误: 致命错误:未捕获异常“PDOException”并带有消息 '

回答 5 投票 0

根据指示变量计算列的差异

我想根据指标列是“grp1”还是“grp2”来计算下面列 col1 的值之间的差异。我可以通过创建一个子集来手动执行此操作,但这变得不...

回答 1 投票 0

Pandas 条件 groupby:使用谓词对分区进行聚合

我已经多次执行此任务,因此我想知道是否可以在使用谓词时以 OVER PARTITION BY 样式进行聚合。 window的groupby的SO上有几十个例子

回答 1 投票 0

每个 ID 的“子 ID”值之和

我有这种数据框: ID ID2 特征1 特征2 特征3 特征4 特征5 0 2 2 8 5 7 3 7 1 2 2 4 8 8 ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.