aggregate 相关问题

聚合是指对统计中常用的分组数据进行汇总的过程。

折叠/将多行聚合为单行,并基于相同的 ID 共享百分比

我需要一些关于如何聚合行共享 ID 以获取百分比数据的建议/提示。 我的数据框格式为: id 县_1 国家/地区_2 国家/地区_3 .... 国家/地区_x sum_by_id 1 10 ...

回答 1 投票 0

完整案例的聚合工作

我想通过字符向量聚合多个列。然而,我认为基本 R 聚合适用于完整的情况,因此如果一个变量缺少求和变量,则该变量将被排除在外......

回答 1 投票 0

Pandas Groupby——如何从组中提取第一个、最后一个或第一个非 NaN 值

这个问题反复出现在我面前,我确信有一种方法可以将其作为 groupby().agg() 命令的一部分来实现,但我无法弄清楚。我经常需要对时间序列进行重新采样,并且需要保留一个值...

回答 1 投票 0

Pandas 中的命名滚动聚合自定义函数

我无法找到一种方法来正确命名应用于滚动窗口的自定义聚合函数。 这个答案很好地解释了 groupby 聚合。我尝试过使用 pd.NamedAggregates,就像这样 df .ro...

回答 3 投票 0

匹配/过滤/项目对象中数组中数组的嵌套字段

我需要一点帮助,我尝试从嵌套数组中提取一些字段,但仍然很困难,有人可以帮忙吗? 这是示例文档: [ { _id: 1, “_A”: [ { “_p”...

回答 1 投票 0

Dataframe聚合方法传递列表问题

这可能是一个错误,但是您对此 pandas 功能有何看法: df = pd.DataFrame(np.arange(20).reshape(10,-1), columns=[*'AB']) 定义 f(x): 打印(类型(x)) df.agg(f) 输出: 这可能是一个错误,但你对这个 pandas 功能有何看法: df = pd.DataFrame(np.arange(20).reshape(10,-1), columns=[*'AB']) def f(x): print(type(x)) df.agg(f) 输出: <class 'pandas.core.series.Series'> <class 'pandas.core.series.Series'> A None B None dtype: object 但是,如果我将 agg 方法中的函数调用包装在括号中,并将单个函数作为列表传递。 df = pd.DataFrame(np.arange(20).reshape(10,-1), columns=[*'AB']) def f(x): print(type(x)) df.agg([f]) 输出: <class 'int'> <class 'int'> <class 'int'> <class 'int'> <class 'int'> <class 'int'> <class 'int'> <class 'int'> <class 'int'> <class 'int'> <class 'int'> <class 'int'> <class 'int'> <class 'int'> <class 'int'> <class 'int'> <class 'int'> <class 'int'> <class 'int'> <class 'int'> A B f f 0 None None 1 None None 2 None None 3 None None 4 None None 5 None None 6 None None 7 None None 8 None None 9 None None 所有更改是将自定义函数作为单个值列表传递。 在您的情况下,您应该考虑使用 apply 而不是 agg,因为您的函数不执行多个值的聚合。

回答 1 投票 0

在 R 中按模式对数据帧进行分组

我有 R 数据框,有数百行 词频 种子 4 种子 3 合同2 承包2 河1 我想按模式对数据进行分组,比如种子+se...

回答 4 投票 0

返回 MongoDB 中没有关联文档的链接

我有一组网页存储在 MongoDB 中。每个文档至少包含一个主机名和路径名值以及在字段“a”中找到的所有链接的数组。该文档仅在...之后存在

回答 1 投票 0

根据另一个变量选择分组行

我有一个数据集,其中每个区域都有一个值 pos,但有些区域的值不是 1。 地区 <- c('A','A','B','B','C','D','D','E') pos <- c(0,1,0,1,0,0,1,0) df <- data.fr...

回答 1 投票 0

在 mongo 聚合管道的小组阶段排除某个字段,但在最后将其包含回来

我有一个 mongo 聚合查询,如下所示: db.someCollection.aggregate([ { $match: { taskId: "qy7u17-xunwqu" } }, // 按“tracklet_id”分组并计算每个

回答 1 投票 0

sql 中的分组依据和最小聚合器(带连接)

我正在尝试教我的 sql 并正在做 hackerrank 练习题。我遇到了奥利凡德的库存问题,其中内容如下:哈利·波特和他的朋友们在奥利凡德......

回答 3 投票 0

使用 R 中的特定条件聚合 nc 文件

我再次需要你的帮助。 我有 .nc 文件,元数据: 文件 minty.nc (NC_FORMAT_64BIT): 1个变量(不包括维度变量): 短 mn2t[经度、纬度、时间] 比例因子:0。

回答 2 投票 0

在 Excel 中使用列选择进行 SUMIFS

假设我有一张这样的桌子: 分支 类型 扬 二月 三月 b1 其他 100 120 130 b1 其他 10 20 30 b1 租 5 6 6 b2 租 2 2 5 b2 租 1 1 b2 其他 2 4 我想聚合数据并获得新的

回答 1 投票 0

使用explode()作为聚合函数[重复]

如何分解 pd.pivot_table() 中的重复索引行? 将 pandas 导入为 pd df = pd.DataFrame({ “组”:[1,2,2,3,1,2,3], “面板”:[1,1,1,1,2,2,2], “价值&

回答 1 投票 0

根据历史数据计算一年中每个小时和每天的天气数据平均值

我需要在r编程中根据2015 - 2023年每小时的历史数据计算一年中每一天和每一小时的气象数据平均值。每小时平均值将用于

回答 1 投票 0

如何使用多个变量从聚合数据中获取条形图下的列名称?

我有一个名为 ufc.csv 的包含树木数据的数据文件,在使用 read.csv() 函数读取它后,我使用聚合函数来获取树木直径 (Dbh) 和树木高度 (Height) 的平均值)是...

回答 1 投票 0

如何使用多个变量从 RStudio 中的聚合函数获取条形图下的列名称?

我有一个名为 ufc.csv 的包含树木数据的数据文件,在使用 read.csv() 函数读取它后,我使用聚合函数来获取树木直径 (Dbh) 和树木高度 (Height) 的平均值)是...

回答 1 投票 0

对子组进行分组时计算百分比

我有以下数据框(这是一个示例): df <- data.frame(groupID = c("Jon", "Jon", "Jon","Jon", "Jon", "Maria", "Mari...

回答 1 投票 0

使用 R 中的两个分组列计算因子水平的总长度

我试图弄清楚如何使用两个分组列来聚合一列,该列是具有二元结果(成功/失败)的因素。一项挑战是尝试为

回答 2 投票 0

如何对数据帧向量中的特定级别求和?

我有一个包含三种情况的数据框,其中两种代表满足,一种代表未满足。我需要根据情况列的级别(部分满足和完全满足)添加第 n 列。我可以创建一个...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.