group-by 相关问题

GROUP BY是SQL关系数据库标准中的一个命令,用于将共享字段值的一组行折叠为单个行。可以在组中的其他字段(例如SUM()或AVG())上执行聚合函数,以将相关数据整理为单个值。

Pandas 在组内滚动总和

我正在尝试计算每个组内的滚动总和或任何其他统计数据(例如平均值)。下面我给出一个例子,窗口为2,统计量为sum。 df = pd.DataFrame.from_dic...

回答 1 投票 0

如何获得所有分组中存在的唯一值组合

我想知道产品现有的 uom 值组合是什么。 给定 df = pd.DataFrame([{'prod_id':3,'uom':'PK'},{'prod_id':3,'uom':'PQT'},{'prod_id':4,'uom': 'PK'},{'prod_id':5...

回答 1 投票 0

从单个列创建多个列并按 pandas 进行分组

work = pd.DataFrame({"JOB" : ['JOB01', 'JOB01', 'JOB02', 'JOB02', 'JOB03', 'JOB03'], “状态”:['ON_ORDER','ACTIVE','TO_BE_ALLOCATED','ON_ORDER','ACTIVE','TO_BE_ALLOCATED'],...

回答 2 投票 0

groupby Pandas DataFrame 上的线性回归

目前我的代码设置如下: def lregression(数据, X, y): X = df['销售额'].values.reshape(-1, 1) y = df['目标'] 模型=线性回归() 结果 = model.fit(X, y)

回答 1 投票 0

计算 10 年时间间隔内的记录数量

我在 Verisk Touchstone 经营一个地点,想了解平均每 10 年发生多少次飓风事件(记录)。 我可以通过运行以下脚本来解决这个问题(见下文)...

回答 1 投票 0

有条件的分组 - 最佳实践

我想要一个带有条件的groupby,然后将结果反馈到原始数据帧。在这种情况下,特征“COl_COND”可以是1或0,并且要汇总的特征是“AMMOUNT”。 ...

回答 1 投票 0

如何在Python中按组应用简单线性回归?

目前我的代码设置如下: def lregression(数据, X, y): X = df['销售额'].values.reshape(-1, 1) y = df['目标'] 模型=线性回归() 结果 = model.fit(X, y)

回答 1 投票 0

如果列值存在则SQL查询进行分组,否则列出所有记录

我在 SQL 数据库中有一些报告。有些报告有报告编号,有些报告没有报告编号。 报告ID 报告创建者 版本 报告编号 1 约翰·史密斯 1 101 2 约翰·斯姆...

回答 1 投票 0

在 Oracle SQL 中使用自定义无不相交组进行分组

Oracle 19c 我有一个包含 20 多个带有数值的列的表,我想通过基于一列的自定义组对它们进行求和。例如,在下表中,我想要 Quant_1 和 Qua 的总和...

回答 1 投票 0

SQL 在汇总时合并行

我在 SQL Server Express 中有一个视图,显示每个日期汇总的总值 以下是当前视图的构建方式 选择 COALESCE(MACH, '总计') AS MACH, 合并(日期,'')为'

回答 1 投票 0

删除特定 ID 组内 7 天内的相互观察结果

我有一个 pandas 数据框,其 ID 和日期如下所示: ID 日期 111 16/09/2021 111 14/03/2022 111 18/03/2022 111 21/03/2022 111 2022年3月22日 222 27/03/2022 222 2022年3月30日 222 2022 年 4 月 4 日 222 6...

回答 1 投票 0

每组的滚动平均值、计数或分位数

我有一大组毫秒粒度的刻度数据,我已将其加载到 pandas DataFrame 中。为了使处理更容易,我添加了将每个时间戳分配给年份、月份的列...

回答 1 投票 0

替代 SQL Server 2016 之前的 STRING_AGG

我需要按一组值以及每组的所有匹配行号/id:s 对表进行分组。此操作必须在 SQL Server 2016 的范围内完成。 假设我有

回答 2 投票 0

为什么 .bfill().ffill() 对组的作用与 ffill().bfill() 不同?

我认为我在概念上遗漏了一些基本概念,但我无法在文档中找到答案。 >>> df=pd.DataFrame({'a':[1,1,2,2,3,3], 'b':[5,np.nan, 6, np.nan, np.nan, np .nan]}) >...

回答 1 投票 0

在 pandas 数据框中实现 n 名玩家 Elo 评级

抱歉,如果这是一个相当复杂的问题。 我有一个 pandas 数据框,记录不同玩家之间的比赛结果: Race_ID记录不同的比赛 Racer_ID记录不同的比赛...

回答 1 投票 0

将 xml 读入 LINQ 格式以检查日志文件数据 - 列表格式的条件 - linq 未拾取重新格式化的 xml

我有一个项目,它读取每个构建区域的预期构建结果的 xml,并与构建日志进行比较以查看构建是否通过。现在,linq 在单独的

回答 1 投票 0

从多表连接分组的 LINQ 子集结果

我有4张桌子: 用户: -用户密钥 -用户名 角色: -角色密钥 -角色描述 允许: -permissionKey -权限描述 用户角色权限: -用户密钥 -角色密钥 -permissionKey 这是数据库查询... 选择 你.

回答 1 投票 0

在 SQL 中查找因同一初步诊断多次入院的患者

需要有关以下 SQL 查询的帮助。 问题陈述 - 显示入院时的患者 ID、主要诊断。查找因同一primary_diagnosis而多次入院的患者 表 - 招生 T...

回答 5 投票 0

在 MySQL 中使用或不使用 ORDER BY 按“排名计数”列对用户进行排序

我有一个游戏,它有 10 个世界,每个世界有 20 个级别。 并有一个像这样的排名表: ID 用户身份 世界号 级别编号 秩 # 用户ID1 1 1 3 # 用户ID1 1 2 1 # 用户ID1 5 15 12 # 使用...

回答 1 投票 0

计算每月和按组的累计总和

我首先通过使用 group-by 和 mutate 计算组内的 ID 来计算每月总和。但是,当我尝试使用 cumsum 来使用 cumsum 按组计算每月累计总和时,数据只是...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.