group-by 相关问题

GROUP BY是SQL关系数据库标准中的一个命令,用于将共享字段值的一组行折叠为单个行。可以在组中的其他字段(例如SUM()或AVG())上执行聚合函数,以将相关数据整理为单个值。

Pandas 按筛选结果分组

我正在使用 pandas 并获取数据并使用 group by。但是我不确定如何过滤掉返回的不需要的数据。我只想要 1 的计数,而不是 0 的计数。 打印(df.groupby(项目)['

回答 1 投票 0

在 pandas 中使用 group_by 但有条件

我有数据框 数据 = {'时间': ['10:00', '10:01', '10:02', '10:02', '10:03', '10:04', '10:06', '10:10', '10:15'], '价格': [100, 101, 101, 103, 101,101, 105, 106, 107], “音量”:[...

回答 1 投票 0

Pandas - 数据透视表中总数的百分比

有史以来第一篇文章;感谢任何人的帮助! 我曾经在 DAX 中相当快地解决此类问题,但作为 pandas 的新手,我已经在这个问题上停留了一段时间: 我正在尝试输出...

回答 1 投票 0

PostgreSQL 在generate_series 之后重新分组,同时连接可能为空值的不同表

在我的数据库中,我有各种带有主键、开始日期和结束日期的表 我正在尝试创建一个视图表来连接其中一些周期,以便我可以将该表发送到 PowerBI 并使用它。 我的...

回答 1 投票 0

“每个 GROUP BY 表达式必须至少包含一列不是外部引用。”当 GROUP BY 包含常量时报告。为什么?

存在大量与“每个 GROUP BY 表达式必须包含至少一列不是外部引用”相关的问题。错误,以及在 GR 中包含常量值...

回答 2 投票 0

如何根据一列的值有条件地选择前N个组并按两列分组?

这是这篇文章的后续 这是我的数据框: df = pd.DataFrame( { 'a': [10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 10, 22], 'b': [1, 1, 1, -1, -1, -1, -1, 2, ...

回答 1 投票 0

如何根据特定年龄范围查找付款总额

我正在尝试解决MySQL中的一个问题,其中有一个保险表,通过该表我需要根据年龄范围找到总付款额。比如,0-10就有一定的支付金额,...

回答 1 投票 0

这段代码有什么问题?如何在不删除“Microsoft”的情况下更正此代码?

这是代码的屏幕截图 使用 pandas 计算每个财务指标的同比变化。您可以通过在 DataFrame 中创建代表百分比的新列来做到这一点...

回答 1 投票 0

teradata 中的多行由 group by 产生的情况

我正在尝试对一堆行进行连接,但在添加列的值之前需要验证一些条件,所以基本上可以说我有一个包含 userId 的表,一个

回答 1 投票 0

获取某个年龄段的平均年龄和中位年龄

来自以下人群: 0-9 10-19 20-29 30-39 40-49 50-59 60-69 70-79 80-89 90-99 100-109 110-119 男-692 -772 -741 -698 -707 -511 -371 -203 -95 -...

回答 1 投票 0

更改 pandas 数据框的行号

我有以下数据框 0-9 10-19 20-29 30-39 40-49 50-59 60-69 70-79 80-89 90-99 100-109 110-119 1 -692 -772 -741 -698 -707 -511 -371 -203 -95 -17 -8...

回答 1 投票 0

使用 pd.BooleanSeries 过滤 groupby 的结果

考虑让两个数据框共享一列。 df = pd.DataFrame([{'a': 1, 'b':2}, {'a':2, 'b': 4}]) df2 = pd.DataFrame([{'a': 1, 'c':2}, {'a': 1, 'c':3}, {'a':2, 'c': 4}, { 'a':2,'c':5}]) 组...

回答 1 投票 0

当时间信息分为列和索引时,将数据帧重塑为时间序列?

下面的数据框跟踪参数“速率”、“压力”和“切割”的每日变化。日期信息分为“月和年”列(2024 年 1 月、12 月 2 日...

回答 1 投票 0

我把所有代码都敲好了,就是只有group_by函数不行

数据(谋杀) 谋杀_2 <- murders %>% 变异(比率 = 总数 / 人口 * 100000) %>% 变异(idx = case_when(比率 < median(rate) ~ "low", TRUE ~ "high")) %>% 选择(

回答 1 投票 0

如何更改 groupby 范围以查找满足掩码条件的第一个值?

这是这篇文章的扩展。 我的数据框是: 将 pandas 导入为 pd df = pd.DataFrame( { '主':['x','x','x','x','x','x','x','x','x','y','y',' y', 'y', 'y', 'y', 'y'], ...

回答 1 投票 0

如果初始groupby找不到满足掩码条件的第一行,如何更改groupby列?

这是我的数据框: 将 pandas 导入为 pd df = pd.DataFrame( { '主':['x','x','x','x','x','x','x','x','x','y','y',' y', 'y', 'y', 'y', 'y'], 'sub': ['c', 'c', 'c', '...

回答 2 投票 0

按年龄组划分的粉丝百分比 SQLITE

嘿伙计们,我需要一些帮助,我无法正确执行...... 我有两个查询可以让我获得获得正确百分比所需的结果。 第一个查询: 选择日期、年龄组、SUM(粉丝数)来自

回答 1 投票 0

如果初始groupby找不到满足掩码条件的第一行,如何更改groupby列?

这是我的数据框: 将 pandas 导入为 pd df = pd.DataFrame( { '主':['x','x','x','x','x','x','x','x','x','y','y',' y', 'y', 'y', 'y', 'y'], 'sub': ['c', 'c', 'c', '...

回答 1 投票 0

Python Pandas:如何对组中的所有项目进行分组并为其分配 id?

我有df: 域名组织 csyunshu.com 108299 dshu.com 108299 bbbdshu.com 108299 cwakwakmrg.com 121303 ckonkatsunet.com 121303 我想添加一个带有 repl 的新列...

回答 4 投票 0

如何根据列的上升条纹创建组?

这是我的数据框: 将 pandas 导入为 pd df = pd.DataFrame( { 'a': [10, 14, 20, 10, 12, 5, 3] } ) 这是预期的输出。我想创建三个组: A 0 10 1 14...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.