pandas-groupby 相关问题

用于根据给定条件将变量分组在一起。并且仅用于与“pandas”库相关

pandas分组并将行转换为多列。

data = {'groupId':[1,1,2], 'email':['[email protected]', '[email protected]', '[email protected]'], 'type':['office','personal','personal']} df = pd.DataFrame(data) 我有一个像这样的数据框 groupId ... ...

回答 1 投票 0

在Pandas DataFrame中,如果有重复的行存在,则将该列相加。

我有一个相当大的数据集,看起来类似于下面的数据集。这个数据集包含10多个列,这些列都有相同的值,然后是一个 "时间 "列,它将包含唯一的值。我是 ...

回答 1 投票 -1

Python,pandas数据框架,groupby列和预先已知的值。

考虑这个例子: >>> import pandas as pd >>> df = pd.DataFrame( .... [ ... ['X', 'R', 1], ... ['X', 'G', 2], ... ['X','R',1],......['X','G',2],......。['X','B'... ...

回答 1 投票 0

pandas数据框架的groupby给出了错误的结果。

我试图复制一篇论文,其代码是用Stata写的,用于我的课程项目,使用Python。我很难复制他们do-file中的collapse命令的结果。该 ...

回答 1 投票 0

一个熊猫式的方法来寻找满足某些条件的主体。

很抱歉,如果这太基本了,但我对python(尤其是pandas)完全是个新手。我有一个大学生人文和数学成绩的样本数据。我想找到(a)学生们的 ...

回答 1 投票 0

如何将日期分组到大熊猫中

Datos 2015-01-01 58 2015-01-02 42 2015-01-03 41 2015-01-04 13 2015-01-05 6 ...... 2020-06-18 49 2020-06-19 41 2020-06-20 23 2020-06-21 39 2020-06-22 22 2000行×1列 我有 ....

回答 1 投票 0

No_unit_tested

我还在学习Python,因此我需要一些帮助。我有以下数据。我有以下数据:

回答 2 投票 0

在pandas中创建一个函数,根据给定的参数在数据框中创建新的行。

我有一个数据框架,如下图所示,其中数据总是有一个会话。这意味着在 "Session "列中的唯一值的数量将始终为1。B_ID No_Show Session slot_num ...

回答 1 投票 1

熊猫群比连续行数的累加和。

我试图在pandas中的groupby中得到一个累积的总和和计数,但是只有当但是只对连续的行值。如果值不是连续的,我想累加和...

回答 1 投票 -1

用Pandas GroupBy和重新取样保留最大时间

我有一个Pandas DataFrame,其中有多个站点和每个站点的预测每小时阵风("gust_speed")。我需要找到每个站点每天的最大阵风,以及时间在......

回答 1 投票 1

如何在自己的groupby函数中使用groupby max?

我有以下 df d = {'CAT':['C1','C2','C1','C2'],'A': [10, 20,30,40], 'B': [3,4,10,3]} df1 = pd.DataFrame(data=d) 我想加入一个新的列,它是由'A'除以最高的......所得。

回答 1 投票 0

我想放弃那些标签值=2,3的唯一ID,所以答案应该只有b,d,c。

所以这里有独特的ID列表和标签。我只想知道那些不包括标签=2,3的行。所以答案应该是独特的ID=b,d,c独特的ID标签。

回答 1 投票 0

Pandas GroupBy 列表中的一列列表的值,并找到它们的平均值。

我有一个大的pandas数据框(1M行),格式如下:姓名,情感["Lily","Kerry","Mona"],10["Kerry","Mona"],2["Mona"],0 我想计算一下 "Lily "和 "Mona "的平均情感 ...

回答 1 投票 0

有趣的大熊猫组由困惑

关于分组和总和,我有一个困惑(也是一个有趣的观察)。我有一个NBA数据集,在这个数据集中,我执行了以下两个独立的操作 A : df.groupby('Team')['Salary'].sum()......

回答 0 投票 0

使用pandas groupby时保留原始索引

我有以下数据框,希望按年份分组并返回最大值(但将索引值保留在此处):import pandas as pd dct = {“ date”:[“ 2019-01-01 “,” 2019-04-1“,...

回答 2 投票 0

Pandas GroupBy在列表的一列中列出值并找到它们的均值

我有一个大熊猫数据框(100万行),格式如下:data = {'names':{0:['Lily','Kerry','Mona'],1:['Kerry','Mona '],2:2 ['Mona']},'观点':{0:10,1:2,2,2:0}} df ...

回答 1 投票 2

多个数据帧-宽到长使用熊猫

我有两个数据帧,如下所示df1 = pd.DataFrame({'person_id':[11,21,31,41,51],'date_1':['12 / 30/1961','05 / 29/1967”,“ 02/03/1957”,“ 7/27/1959”,“ 01/13/1971” ...

回答 1 投票 0

列之间的列表关系

我在下面有这个数据框:df = pd.DataFrame({'cnpj':[410000132,410000132,4830624000197,4830624000197,4830624000197],'Nome Pessoa':['EUGENIO LUPORINI NETO','JUAN MATIAS SERAGOPIAN',' EUGENIO LUPORINI ...

回答 2 投票 0

pandas python删除组的最后一行

我需要删除每个组的最后一个成员,因为这会使进一步的计算混乱。我不知道如何更好地解释我的问题,但是如果您需要进一步说明,请提出。我当前的代码:...

回答 1 投票 0

更改具有多个索引的groupby对象中的值

我将以下df分组,然后尝试更改每个类型总和的US值,但得到nan:dff = pd.DataFrame({'country':['US','US', 'UK','UK','FR','FR','ES','ES'],'type':['A'...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.