group-by 相关问题

GROUP BY是SQL关系数据库标准中的一个命令,用于将共享字段值的一组行折叠为单个行。可以在组中的其他字段(例如SUM()或AVG())上执行聚合函数,以将相关数据整理为单个值。

计算多个时间序列中的重复值

我有一个非常简单的问题。我有一个包含多种产品的数据集,以及它们的价格随时间的变化情况。现在我需要确定价格连续不变的时期

回答 1 投票 0

对整个数据帧进行分组与对数据帧的列子集进行分组

我正在一个代码库中工作,我看到很多像这样的 groupby 用法,它们对 df 列的子集进行操作 df[cols].groupby(some_column).nunique()[column2extract] 其中 cols 包括

回答 1 投票 0

groupby 和将列乘以标量

我写了这段代码: tmp_ml['mode_dur_secs_lb'] = tmp_ml.groupby(['id', 'c_num']).apply( lambda x: x['mode_duration_secs']*0.9) 桌子: ID c_num 模式持续时间秒 a1 116 20 a1 第279章 3 a2 9 19 ...

回答 1 投票 0

Pandas 检查前缀和更多校验和(如果搜索到的前缀存在或没有数据)

我有下面的代码片段,效果很好。 将 pandas 导入为 pd 将 numpy 导入为 np 前缀 = ['sj00', 'sj12', 'cr00', 'cr08', 'eu00', 'eu50'] df = pd.read_csv('new_hosts', index_col=False, 标题...

回答 2 投票 0

Python - 枢轴/分组 - pandas 长到宽

我有多个表,它们都具有相同的列。文档包含具有 3 个不同 ID ID1、ID2 和 ID3 的项目。 ID 大多是不同的 accros 表,但有一些重复,并且......

回答 1 投票 0

Pandas 在追星族之后计算滚动平均值

我正在尝试计算分组后值的滚动平均值。 我的数据集看起来像 将 pandas 导入为 pd df = pd.DataFrame({'day': ['2020-01-01', '2020-01-01', '2020-01-01', '2020-01-01', '2...

回答 1 投票 0

在 pandas 中混合聚合和分组

我拥有的是一个名为“报告”的数据集,其中包含送货司机的详细信息。 “通过”意味着他们按时交付,“失败”意味着他们没有按时交付 姓名|结果 A |通行证 B |失败 C |通过 D |帕...

回答 4 投票 0

计算一列在另一列中是否具有特定值

我有一列(user_id)包含数千个user_id(也重复),另一列(字符串)包含几个不同的字符串。我想检查唯一的 user_id 是否具有特定字符串并且...

回答 2 投票 0

对大数据(~150MM+行)进行分组和分析的最快方法是什么?

我有大量历史电价数据集(151mm+)。有 18,065 个独立节点进行价格结算,每个节点每小时进行一次观测(8760 个/年)。 数据模式:节点 ID (int64)、日期时间 (

回答 1 投票 0

获取子组的计数

我找到了 groupby 命令,它可以根据类别的垃圾箱获取计数。我希望获得有关根据两个不同类别的两组不同垃圾箱进行计数的帮助。 例如, ...

回答 1 投票 0

Python 极坐标 - 如何聚合数据帧

目标 在 Python 中有效聚合 Polars 数据框中函数返回的数据帧。 环境 Windows 10 Python 3.9.18 极地 0.20.18 到目前为止我做了什么 我想要同等的...

回答 1 投票 0

pandas 中列的动态计算

我有一个像这样的数据框 巴士_号。城市 3412.加尔各答 第7658章 3412.孟买 5516.加尔各答 第7658章奈 3412.孟买 我需要根据这些进行动态计算

回答 1 投票 0

Pandas - 按字符串字段分组并按一天中的时间范围进行选择

我有一个这样的数据集 索引 日期_时间 通行证_ID El 0 23/3/30 05:12:36.36 A 1 1 23/30/3 05:12:38.38 A 2 1 23/3/30 05:12:40.40 A 3 1 23/3/30 05:12:42.42 A 4 1 23/3/30 05:12:4...

回答 1 投票 0

使用 pandas 聚合分组数据时避免将字符串添加在一起

使用 pd.groupby(['col_1','col_2']).sum() 时将字符串相加。例如,对于某个类别变量 col_3,可能的值为 A、B、C,这可能是分组后成为 AACBB

回答 1 投票 0

如何找到满足每组掩码条件的第一行?

这是我的数据框: 将 pandas 导入为 pd df = pd.DataFrame( { 'a': ['x', 'x', 'x', 'x', 'x', 'y', 'y', 'y', 'y', 'y', 'y', ' y'], 'b': [1, 1, 1, 2, 2, 1, 1, 1, 2, 2, 2, 2], ...

回答 1 投票 0

通过 CodeIgniter 中的 JOIN 和 GROUP BY 子句查询选择分组列值及其计数

我有两张表如下: - tblSaler 销售员ID |销售者姓名 | ----------------------| 1 |索通 | ----------------------| 2 |达利 | ----------...

回答 4 投票 0

使用 Codeigniter 的活动记录按列分组时获取计数

我有一张表格如下: 表名:品牌 编号 |品牌 1 |优衣库 2 | PDI 3 | PDI 4 | H&M 5 |优衣库 我需要的结果是: PDI×2 优衣库 x 2 H&M x 1 我有

回答 1 投票 0

Pandas:根据分组获取每列的值计数

我的调查结果如下: ID 类别 问题1 问题2 1 A 同意 同意 2 A 不同意 同意 3 乙 同意 同意 4 乙 不同意 不同意 我想用pandas来获取值的数量...

回答 1 投票 0

计算组中唯一值的数量

我有数据,多年来,我的观察结果被分类为cat。任何一年中的观察结果 i 都可以属于多个类别,但在各个年份中都是唯一的。我正在尝试计算独特的价值...

回答 1 投票 0

注释后的 Django group by 不起作用

我有以下 Django 模型: 类订单(模型.模型): ... org_slug = models.CharField() 类 ProductToOrder(models.Model): order = models.ForeignKey(Order, on_delete=models.C...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.