group-by 相关问题

GROUP BY是SQL关系数据库标准中的一个命令,用于将共享字段值的一组行折叠为单个行。可以在组中的其他字段(例如SUM()或AVG())上执行聚合函数,以将相关数据整理为单个值。

按参考组划分不同组

到目前为止我有这个 df: (不是列结果): df <- data.frame(number = c(1,1,1,1,2,2,2,2,3,3,3,3), value1 = c(5,7,6,9,3,5,6,3,4,5,5,6), group = c("control&

回答 2 投票 0

为什么在 IN 子句中使用 GROUP BY 会导致查询无法执行?

选择 id、user_id、item_id 来自调查问卷_answer_old_0 其中 item_id IN ( 选择item_id 来自调查问卷_answer_old_0 按用户 ID、项目 ID 分组 有 COUNT(user_id) > 1 ...

回答 1 投票 0

如何删除每组pandas python中的前导0记录

假设有记录 指数 命令 团体 数据 1 1 A 0 2 2 A 0 3 3 A 0 4 4 A 1 5 5 A 2 6 6 A 1 7 1 乙 0 8 2 乙 2 9 3 乙 -1 10 4 乙 0 11 5 乙 2 12 6 乙 4 我想排除前导 0 r...

回答 1 投票 0

在 R 的列中查找唯一值

我有视频数据,我正在尝试制作一个新表格,总结视频中迄今为止唯一用户数量的信息。第一张表是我有的,第二张表是……

回答 2 投票 0

pandas:如何以给定频率将记录聚合到滚动时间窗口中?

这是我的数据: times = pd.date_range(start=pd.Timestamp.now(), end=pd.Timestamp.now() + pd.Timedelta(分钟=1), 周期=61) 数据 = np.arange(61) df = pd.DataFrame({'次':...

回答 1 投票 0

pandas 数据框中的枚举,无法在枚举列上进行 groupby 吗?

我刚刚了解了枚举,并认为它们适合我正在编码的东西。但是当我运行这段代码时,出现错误。我是否试图做一些我不应该做的事情或者这是一个错误? 当...

回答 1 投票 0

Python 将列值拆分为多列并保持其余列相同

我的数据如下。在这方面,我希望将 A 列的值拆分为不同的列,并具有相应的第 2 列值的值,并且需要第 3 列包含相应的值...

回答 1 投票 0

Pysaprk 使用 groupBy() 和 colRegex

我尝试将 groupBy() 与 colRegex 结合起来 所以我想自动将所有带有后缀“B_”的列和最后一列“Prio”与最大值聚合。 但无论如何我尝试它都不起作用。

回答 1 投票 0

为什么 vs code 返回错误 - AttributeError: 'int' object has no attribute 'where',但相同的代码在 Google Colab 上运行没有任何问题

以下代码在 vs code 中不断返回 AttributeError,但在 Google Colab 上运行相同的代码时,不会产生此类错误: 代码: 将 numpy 导入为 np 将 pandas 导入为 pd url = 'https://...

回答 1 投票 0

通过变换获取pandas group内的组名称

这就是我正在尝试做的事情。我在 pandas 中有以下 DataFrame: 将 numpy 导入为 np 将 pandas 导入为 pd n_列 = 3 n_样本 = 4 df = pd.DataFrame(np.arange(n_samples * n_cols).reshape(

回答 1 投票 0

Pandas 随机排列数据框中组内的行,保持相对组顺序不变

给定以下 df: 数据 = {'Org':['汤姆','凯利','瑞克','戴夫','萨拉','莉兹'], '总和': [3, 4, 4, 4, 5, 5]} df = pd.DataFrame(数据) # 组织总和 #0 汤姆 3 #1 凯利 4 # ...

回答 1 投票 0

F# - GroupBy 并将函数应用于第二个元组项内的每个属性

我有一个 F# 类列表,我正在使用这些类的属性来访问数据(我正在使用用 C# 开发的库)。我想按一个属性进行分组,然后对每个专业应用一个单独的函数...

回答 1 投票 0

Sum value_count() 输出

homes_by_state = df_south.groupby(["state"])["property_type"].value_counts() 我只想输出“state”和“property_type”的总数

回答 1 投票 0

为什么pandas groupby.diff不使用分组键作为索引?

pandas groupby().diff() 操作不遵守默认的 index=True 参数,并且不使用 groupby 中的键作为索引。 与其他聚合函数(例如 groupby().sum() 或

回答 1 投票 0

在 r 中,转置列并分组

在 R 中,来自以下示例 df: df <- as.data.frame(ID= c("ACTA", "ACTZ", "APHT", "ACTA", "ACTZ", "APHT"), d...

回答 1 投票 0

SQL - 在 Group By 中使用别名

只是对 SQL 语法感到好奇。所以如果我有 选择 itemName 作为 ItemName, substring(itemName, 1,1) 作为 FirstLetter, 计数(项目名称) 从表1 GROUP BY 项目名称、首字母 这将是不合...

回答 12 投票 0

使用 groupby as_index=False, count, to_frame 给出 'Dataframe' 对象没有属性 to_frame

我正在尝试使用 groupby()、count() 和 to_frame() 从现有数据帧创建一个新数据帧。我收到 AttributeError: 'DataFrame' object has no attribute 'to_frame' after ad...

回答 1 投票 0

SQL 查询对同一行中的类似值进行分组并对其他值进行连接和排序

使用 SQL 版本 15.0.2000.5 我有一个包含这些数据的表: 学生时间表ID 周一 周二 周三 周四 星期五 星期一开始时间 周一结束时间 星期二开始时间 星期二结束时间 星期三开始...

回答 2 投票 0

如何过滤在 pandas 中的两个其他事件之间发生事件的用户?

我有一张如下所示的表格: 用户身份 事件 时间戳 1 发射 2023-09-15 14:31:44 1 买 2023-09-15 14:31:49 1 取消 2023-09-15 14:31:50 1 添加 2023-09-15 14:31:52 2 添加 2023-...

回答 1 投票 0

Groupby 按条件过滤的滚动计数

我的数据集包含以下格式的交易列表: 交易ID 卡号 交易日期时间 数量 店铺 1 123 2023-06-24 12:20:24 100.0 A 2 第456章 2023-08-27 23:12:00 250.0 乙 3 123...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.