pandas-groupby 相关问题

用于根据给定条件将变量分组在一起。并且仅用于与“pandas”库相关

按多列分组并丢失数据时,遍历Pandas的groupby输出

按缺少数据的多列分组:data = [['Falcon','Captive',390],['Falcon',None,350],['Parrot','Captive',30],['Parrot ','Wild',20]] df = pd.DataFrame(data,columns = ...

回答 2 投票 0

如何将DateTime多索引恢复为正常的DateTime索引?

我有两个数据帧,它们的索引不同,如下所示; df1:C1是M D 2020 5 1 5 2 7 3 34 4 4 ...

回答 2 投票 0

从pandas groupby创建列

我正在尝试按性别计算每部电影的收视率差异。 (IMDB数据集)这是我使用过的groupby方法:df.groupby(['电影标题','性别'])['评分'] .mean()和头:我想...

回答 1 投票 0


在数据帧Python中组合相同的字符串

我们在下面的数据帧d1 = {'data':['python','Python','PYTHON','conda','COnda','CONDA',],'Value':[50,25,30 ,25,40,25]} df = pd.DataFrame(d1,columns = ['data','Value'])...

回答 3 投票 0

熊猫数据帧中每列中特定值的出现次数

我有一个像这样的熊猫数据框0 1 2 3 4 5 6 7 8 9 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 0 3 0 0 0 ...

回答 1 投票 0

Python group by并找到与条件匹配的第一个序列

所以我是一个初学者,我发现了很多有关如何找到符合条件的第一个序列帽子的文章,但我不知道如何将其与“分组依据”功能结合使用并显示新列。我需要...

回答 1 投票 0

如何使用熊猫找到大学和全球排名?

我有以下数据框:Agent_Name college_name得分college_local_ranking global_ranking Anna Harvard 60 1 4 Mathew oxford 99 ...

回答 2 投票 0

查找pd.DataFrame [duplicate]中最大值的最后一次出现的索引

我需要在pd.DataFrame中找到argmax索引。我想要的结果与pandas.DataFrame.idxmax完全一样,但是此函数返回在请求的轴上第一次出现最大值的索引。我想要...

回答 1 投票 0

通过Pandas DataFrame分组并分别绘制分组

我有来自不同雨量计站的数据,我想在图中进行比较。 DM_a InputID目标ID date_ini date_end距离0 P1311 P1311 1951-01-01 2015-12-31 ...

回答 1 投票 1

关键错误:未找到列…但是在那儿

我正在尝试将月份分组在一起,然后创建一个计数列,以便以后可以对其进行图形显示。但是,我一直收到以下错误KeyError:'找不到列:计数'我不明白...

回答 2 投票 0

Pandas-如何遍历groupby以计算发生次数

我有一个如下所示的DF:我想按价格分组,计算每个价格的动作== N / U / D的出现次数。 ID,动作,指示器,边,价格,数量7930249,U,0,A,132.938,23 ...

回答 1 投票 0

总计DataFrame行的一列包含一个子字符串

我有这个DataFrame:df1:日期值信息1 1 XXX.othertext2 1 4 somerandomtext 1 2 XXX.othertext2 1 3 XXX.othertext3 1 ...

回答 1 投票 0

均值由两列分组,窗口乘以3个月,NaN少于3个月

我必须按客户,帐户在此数据集中应用均值计算,但是在这些组中每3个月均需要应用此均值。对于没有3个月的客户A1200,结果...

回答 1 投票 1

在多个列上对熊猫分组依据,并在新数据框中选择在分组依据中使用的所有那些列

选择count((ErrorCode)作为“ counterr”,DateOnly,System_id,ErrorType,ErrorCode从dbo.error分组,由(DateOnly,System_id,ErrorType,ErrorCode)我必须将此sql代码转换为熊猫,并希望...] >

回答 1 投票 0

Python数据框:如何将列值与相邻列值映射?

[使用带有python的pandas映射具有相邻列值的列值具有值为名称exm_date att_date tom的df 2019-03-05 11:48:03.166 ...

回答 1 投票 0

按每个组的数据提取组

我有一个Excel工作表partnerData.xlsx电子邮件,名称日期RegPushupCount EasyPushupCount DifficultPushupCount [email protected] John 2020-05-01 5 0 ...

回答 1 投票 1

两列取决于第三列的值。我该如何链接这些值

我有如下数据框:hello = pd.DataFrame(data = {'citing':[11,13,11,15,17,18,18,17,20,15],'cited'[13, 15,18,20,18,15,15,20,13,11],\'firm':'A','D','A','C','D','C','C ',...

回答 1 投票 0

在大熊猫中进行分组并过滤后的fillna

我想在填满古比之后填充nan,并过滤掉大熊猫。例如,我想按“标签”分组并过滤是否同时存在nan和nan。如果两个条件都满足,我将填写...

回答 1 投票 0

熊猫在另一列中的每个组获得最高频率值

我有一个这样的Pandas数据帧:id颜色大小测试0 0蓝色中等1 1 1蓝色小2 2 5蓝色小4 3 2蓝色大3 4 3红色小4 5 4 ...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.