pandas-groupby 相关问题

用于根据给定条件将变量分组在一起。并且仅用于与“pandas”库相关

只有当观察数超过X时,Pandas groupby才会显示

我有以下代码,我将列预测与列置信度的平均值分组,然后我排序到最高10.我需要对...内的观察数量进行限制

回答 1 投票 0

如何在两个列中获得最大组,并在pandas数据帧中将第三个加起来?

所以我在熊猫数据框架上使用了一个小组,看起来像这个df.groupby(['year','month'])['AMT']。agg('sum')我得到的东西就像今年的2003年1 114.00 2 ...

回答 2 投票 2

如何将groupby用于将数据保存在新数据框中,并使用Python 2.7在pandas中按日期时间排序

我想将我的df的列“Location”分组保存在new_df中,并按照Python 2.7列“datetime”排序这是我的df:>> df DateTime产品位置值0 12 -...

回答 1 投票 1

GroupBy数据帧并找出另一列的最大出现次数

我必须在python 3.x中的数据帧上使用groupby()。列名是Origin,然后根据原点,我必须找出具有最大出现次数的目的地。样本df就像:年...

回答 2 投票 1

熊猫:在事件发生时填充缺失值

我已经问了一个类似的问题(见这里),但不幸的是它还不够清楚,所以我决定用一个更好的数据集创建一个新的例子和一个新的解释...

回答 2 投票 0

ValueError:操作数无法与形状一起广播(7410,)(3,)

我有以下格式的df:优先级Mined_Category服务器date_reported计数Zscore_Volume 1 - 严重内存问题xxxxxx111 2018-07-11 1 nan 1 - 严重...

回答 1 投票 1

Pandas意味着与字符串一起使用的函数

我需要在Pandas数据帧上运行的聚合函数(mean,std,var,min,max等),可以从groupby()。apply()调用,但如果所有值都相同则不丢弃字符串。所以:......

回答 2 投票 0

将Matlab脚本转换为Python。

我想帮助将Matlab脚本转换为Python。该脚本将数据从日历年重新排序到水年。我想学习用Python和Pandas做类似的事情......

回答 1 投票 -4

如何基于groupby,pandas DataFrame创建一个新的词典列?

我在Python3.x中有以下pandas DataFrame,有两列字符串。导入pandas为pd dict1 = {'column1':['MXRBMVQDHF','LJNVTJOY','WHLAOECVQR'],'column2':['DPBVNJYANX','...

回答 1 投票 0

将派生字段更改为float并获取派生字段的平均值

我有一个名为FP的数据框,有13列,派生了一个名为price / sqm的新字段,并删除了10列。 FP ['price / sqm'] = FP ['price'] / FP ['floor_area_sqm'] FP = FP.loc [:,['year','town','type',...

回答 2 投票 0

pandas groupby:* full *在原始索引上加入groupwise操作的结果

考虑这个df:import pandas as pd,numpy as np df = pd.DataFrame.from_dict({'id':['A','B','A','C','D','B', 'C'],'val':[1,2,-3,1,5,6,-2],......

回答 4 投票 2

pandas字符串以列的值结尾,然后将字符串的开头转换为比较日期

我有以下df,cluster_id金额inv_id inv_date 1 309.9 07121830990 2018-07-12 1 309.9 07121830990 2018-07-12 2 ...

回答 1 投票 1

熊猫:如何在图中标记groupby数据?

我试图绘制以下数据的图表:当我使用df.groupby('Item')。sum()。plot()时,结果:首先,它似乎没有显示所有107条记录,第二条,我不知道不知道如何标记项目名称......

回答 1 投票 0

当行可以属于多个组时,对pandas Series或DataFrame的行进行分组

当Series / DataFrame对象的项目/行每个属于一个组时,pandas的groupby方法很好。但我有一种情况,每行可以属于零个,一个或多个组。一个......

回答 2 投票 1

pandas根据每个组的另一列上的多个条件创建一个布尔列

我有以下df,cluster_id inv_id 1 A1 1 A1 2 A1111A 2 A1111A我想通过cluster_id分组并创建一个名为invalid_inv_id的列,基于...

回答 1 投票 0

如何从数据框中提取值以在条件格式中使用,同时将其应用于某些选定的类别或数据条目?

在图像中我试图计算中位数和标准偏差,但它允许我一次只计算一列我想要一次计算所有三列然后它存储...

回答 1 投票 -4

Python pandas groupby多列,创建字符串列表但总结数字

目前我的数据框看起来类似于:ID年Str1 Str2价值0 1 2014高黑120 1 1 2015高蓝20 2 2 2014中红......

回答 2 投票 2

如何比较连续行并根据条件添加列

我试图计算pandas数据帧中两个连续行之间的差异,并根据我想要填充一些值的列的结果。例如:下面是一个示例数据ID ...

回答 2 投票 0

pandas DataFrame中行的高效成对比较

我目前正在使用一个小型数据集(大约900万行)。不幸的是,大多数条目都是字符串,即使强制使用类别,框架也会在内存中占用几GB。什么 ...

回答 2 投票 1

列中的Python Pandas Sum值如果日期在2个日期之间

我有一个数据帧df可以用这个创建:data = {'id':[1,1,1,1,2,2,2,2],'date1':[datetime.date(2016,1, 1),datetime.date(2016,1,2),datetime.date(2016,1,3),datetime.date(2016,1,4),...

回答 2 投票 4

© www.soinside.com 2019 - 2024. All rights reserved.