pandas-groupby 相关问题

用于根据给定条件将变量分组在一起。并且仅用于与“pandas”库相关

Python:按多列Pandas分组

我试图通过一个扁平化的数据分组,如2列分组为list &第三个应该是该列的行数之和。假设数据框看起来像ColA ColB ColC ColD ...

回答 2 投票 0

我如何绘制一个3个变量的分组?

我想绘制一年内每个客户的月销售数量。在对三个变量df.groupby(['Year', 'Week', 'Client'])[Quantity].sum()进行分组后,我剩下的一列是这样的:......。

回答 1 投票 0

在Pandas中基于组和动态列名的Pivoting A列

我有一个数据框架在python pandas如下。( 前两列,mygroup1 & mygroup2是groupby列) df = **mygroup1 mygroup2 tname @dt @num @vek** a ....

回答 1 投票 0

潘达斯:如何在一个范围之间找到值的索引?

我有一个pandas数据框架,列'Num'中有一系列的数字。 import pandas as pd numbers = np.array([10,15,60,45,37,28]) df = pd.DataFrame(numbers, columns= ['Num'])我将找到所有 ...

回答 1 投票 0

有没有办法使用groupby来计算文本列的平均值?

我一直在使用pandas.groupby来透视数据,并为我的数据创建描述性图表和表格。当对三个变量进行groupby时,我一直遇到一个DataError。没有数字类型...

回答 1 投票 0

基于列值的组比和随机抽样。

我有一个数据框,我想通过grp1,grp2列进行分组,然后根据列how_many从每组中随机抽取样本。这是我的样本数据 grp1 grp2 how_many val 0 ....

回答 1 投票 0

条件行数潘达

我需要在我的数据框架中根据特定的条件添加行号,下面是输入数据框架的图片。我需要在我的数据框中添加行号列,如下图所示(Rank列),所以......

回答 1 投票 0

pandas绘制混合条和线

我有两个groupby操作的结果,第一个m_y_count,是这样的多索引格式(第一列年,第二列月):2007 12 39 2008 1 3 2 120 ......

回答 1 投票 0

计算列表中每个元素在pandas数据框中列中的每个值的perc。

我正在做的 df 是这样的 co1 col2 A ['1','2','er'] A [] B ['1','3','4','abc'] B ['5'] C [] 我想计算 col2 中每个元素在列表中的百分比。

回答 1 投票 0

Groupby Row元素和Tranpose熊猫数据框架。

在Python中,我有以下Pandas数据框。因子值 0 a 1.2 1 b 3.4 2 b 4.5 3 b 5.6 4 c 1.3 5 d 4.6 I... ...

回答 1 投票 2

如何将pandas groupby函数中的数据分配给一个变量?

我有一个关于Pandas的问题。我将数据按列(Districts)分组 GroupByDistrict = df.groupby(['District']),然后我想得到数据 print(GroupByDistrict['Price'].agg(['median','mean'])......

回答 1 投票 1

潘达斯:在每组中创建与平均数有偏差的列。

考虑以下Python中的DataFrame: import pandas as pd df = pd.DataFrame({'id':[0]*3+[1]*3,'y':np.random.randn(6),'x':np.random.randn(6)})这就得到了id y x 0 0 0......。

回答 1 投票 0

Pivot一个多列的pandas数据框架。

我有一个像下面这样的示例数据框架 df1 = pd.DataFrame({'Gender':['Male','Male','Male','Male','Female','Female','Female','Female','Male','Male','Female','Female','Male','Male','Female','Female','Male','Male','Male','Male','Female','Female','Female'],...

回答 1 投票 0

pandas GroupBy列的NaN(缺失)值。

我有一个DataFrame,其中有很多列的缺失值,我希望通过以下方式进行分组: import pandas as pd import numpy as np df = pd.DataFrame({'a': ['1', '2', '3'], 'b': ['4', np.NaN, '6']}) In [4]: df......。

回答 7 投票 139

Pandas groupby在组列中的NaN时,应用了奇怪的行为。

我遇到了一些意想不到的Pandas groupby-apply结果,我也搞不清楚具体原因。下面我得数据框除了2个值的排序是相等的,df1产生的结果......

回答 1 投票 3

Pandas Groupby-根据组的变化添加顺序元素

我有一个这样的df。我想先用A分组,然后用B分组,然后得到序列列,这样每次当子组B改变时,下一个子组的第一个元素是前一个子组的((x+8)-(x%8))+1......。

回答 1 投票 0

在熊猫数据框架中寻找邻居。

我有一个自行车的数据集,其中有商店、销售地点和一些自行车型号的信息列。我需要比较每个商店的型号销售数量。为此...

回答 1 投票 0

如何在多索引列中按月份具体分组,即日期时间索引。

数据框显示的是日期与进出口量,并进一步分化为沿海和区域数据,每天一个月。我希望实现的是俱乐部即所有的......的总和。

回答 1 投票 0

如何在pandas中对多列进行切分,并对另一列的值进行排序。

在一个数据框架中,有多列数据,我想把三列切成片,然后用另一列来排序。imdb.loc[:5, ['A', 'B', 'C']].sort_values(['D'])OP: A B C 1 ...。

回答 1 投票 0

快速、高效的大熊猫 Groupby sum mean无聚类。

在pandas中执行分组和聚合是很容易和快速的。然而,执行简单的groupby-apply函数,pandas已经在C语言中内置了没有聚合的功能,至少在我做的方式... ...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.