group-by 相关问题

GROUP BY是SQL关系数据库标准中的一个命令,用于将共享字段值的一组行折叠为单个行。可以在组中的其他字段(例如SUM()或AVG())上执行聚合函数,以将相关数据整理为单个值。

Pandas Dataframe 中的 Cumsum,但在每年新年的特定日期重置为零

我有一个按时间降序排列的数据帧,并按 Race_ID 和 Student_ID 索引。 Race_ID 日期 Student_ID 标记 1 1/10/2023 1 5 1...

回答 1 投票 0

如何从 GROUP BY 中选择特定记录而不会使进程过载?

我在 EAT OR DRINK 表中有 n 条记录,它们对应于一些可能具有重复 ID 的事件。 对于每个事件,我都需要按 ID 进行分组,并始终证明我们可以吃的东西(GR...

回答 1 投票 0

如果电子邮件匹配,请复制 Sr 号码

我正在 SQL SERVER 2017 中进行查询。我的表有 3 列:Sr#、Email、Duplicate#。 最终目标是如果电子邮件地址重复,则将序列号从 Sr# 列复制到 Duplicate#。对于

回答 1 投票 0

选择在 wp_usermeta 表中的多行上具有合格数据的用户

我正在尝试查找具有所有四个限定值的 user_id ——每个值位于数据库表的不同行中。 我正在查询的表是 wp_usermeta: 字段类型...

回答 3 投票 0

SQL 中的累积数据集

我已经在Python中创建了一个函数,我正在尝试用SQL编写相同的函数。 将 pandas 导入为 pd df['asofdate'] = pd.to_datetime(df['asofdate']) df['month_year'] = df['asofdate'].dt.to_period('M')

回答 1 投票 0

如何基于group by添加新列并向列添加条件?

我有以下代码 将 pandas 导入为 pd 将 numpy 导入为 np 数据 = { 'id': [1,2,3,4,5,6,7], '日期': ['2019-02-01', '2019-02-10', '2019-02-25', '2019-03-05', '2019-03-16', '2019-04- 0...

回答 1 投票 0

根据条件替换并聚合pandas中的行

我有一个数据框: lft rel rgt num 0 t3 r3 z2 3 1 t1 r3 x1 9 2 x2 r3 t2 8 3 x4 r1 t2 4 4 t1 r1 z3 1 5 x1 r1 t2 2 6 x2 r2 t4 4 7 z3 r2 t4 5 8 t4 r3 x3...

回答 6 投票 0

分组依据:类型错误:序列项0:预期的str实例,找到float

我正在尝试在以下数据框中进行分组。 我正在寻找 ville、arrondissement、quartier 和 quartier_av 的独特组合,其中 quartier_av 列将是一个列表。输出...

回答 1 投票 0

从包含任意两个国家之间净出口的 pandas 数据框中,如何获取包含每个国家净出口的第二个数据框?

我有一个数据框 df ,分别在“From”和“To”列中包含任意两个国家之间的净出口。 df.to_dict() 返回 {'来自':{0:'A',1:'A',2:'B',3:'C',4:'D'}, “收件人”:{0:“B”,1:...

回答 1 投票 0

panda groupby 与 lambda

我正在尝试按功能了解熊猫组 将 pandas 导入为 pd 数据=[['a',3],['a',3],['b',1],['a',0],['b',0]] df=pd.DataFrame(数据,列=['房间','值']) 打印(df) sum_df=df.groupby(...

回答 1 投票 0

如何获取第二个 pandas 数据框,显示基于 Python 中包含单向交易的第一个 pandas 数据框的净交易?

我有一个pandas数据框df1,如下所示: 它分三行显示从 A 到 B、B 到 A 和 A 到 C 的出口量。贸易可以双向进行。 df1.to_dict() 返回 {'国家1':{0:'A...

回答 1 投票 0

将具有日期条件的函数应用于 Pandas 组

我有一个包含 4 列的数据框:名称、日期、活动以及与名称和活动相关的费用编号。我正在尝试确定第五列,该列指示成员是否有代表...

回答 1 投票 0

我们如何压缩 panda 系列列表?

对于以下数据框 将 pandas 导入为 pd df = pd.DataFrame([{'id': "A", 'inv' : [1,2,3,4,5]}, {'id': "A", 'inv': [1,2,3,4,5]}, {'id':&...

回答 1 投票 0

通过 GROUP BY 和 JOINS 获取最大值的数据行

我正在使用 ml100k 数据集编写一个查询,该查询可以为我获取每个年龄段评价最高的电影。 这是我的表的定义方式。 用户 编号 |年龄 |性别 |职业 |邮政编码 比例...

回答 2 投票 0

使用 pandas groupby 获取满足条件的最后一行

我有一个像这样的数据框: 日期_从 日期到 商品编号 VALUE_NEW VALUE_OLD 成本变量 1900年1月1日 00:00:00 2022年11月3日 15:31:18 452953 5366,46 4024,71 33.34% 2022年11月3日 15:31:18 2200 年 1 月 1 日 00:00:00 4...

回答 1 投票 0

获取每个 pandas 列值的最后一个条件值

我有一个像这样的Df: 日期_从 日期到 商品编号 VALUE_NEW VALUE_OLD 成本变量 1900年1月1日 00:00:00 2022年11月3日 15:31:18 452953 5366,46 4024,71 33.34% 2022年11月3日 15:31:18 2200 年 1 月 1 日 00:00:00 452953 9...

回答 1 投票 0

在DolphinDB中,如何对一个表执行聚合计算,并按另一个表中指定的范围进行分组?

我打算根据右表指定的[beg_idx, end_idx)范围对左表中的“index”列进行分组,并对每组的“val”值进行求和,如下所示。 ..

回答 1 投票 0

groupby 用于不带 pandas 的多列列表字典

我正在研究一个不使用 pandas 处理数据的问题。 我使用列表数据字典来读取 CSV 数据。 产品年份投诉 'A' 2002 'bla' 'A' 2003 '' 'B' 2003 '' '...

回答 4 投票 0

如何编写代码来处理 R 中 NA 值的平均重复?

我目前正在开展一个科学项目,其中每个样本都有两到三个重复。 数据(我们将数据框称为“原始”)看起来类似于: |样品ID |变量1 | V...

回答 1 投票 0

SQL Group By 某行后进行计算

我的桌子看起来像这样(DB Fiddle) 组ID IX_IN_GROUP 用户身份 测量 1 1 100 7 1 2 101 80 1 3 100 106 1 4 101 140 1 5 100 182 1 6 101 207 2 1 100 3 2 2 101 6 2 3 100 37 2 4 101 ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.