pandas-groupby 相关问题

用于根据给定条件将变量分组在一起。并且仅用于与“pandas”库相关

替换各组中的行,用第一行的值。Pandas组比

下面是一个数据框:df = pd.DataFrame({'A' : ['foo', 'foo', 'bar', 'bar', 'bar'], 'B' : ['1', '2', '2', '4', '1']}) 下面是我想要的样子,下面是我试过的方法......

回答 2 投票 0

潘达斯分组,并在组内按值排序[重复]。

在运行XGBoost并得到预测后,我需要根据组的id对排名进行排序。我已经尝试了几种方法,但不成功。我的数据: id hotel_id rank 1 5 ...

回答 1 投票 0

如何对数据框的行进行采样,以固定组内的特定分布?

我有一个DataFrame c,其中包含一个列a.import numpy as np a = np.random.randint(0,10, size=(100)) c = pd.DataFrame(a, columns=['a']) 我想对c的行进行随机分组,这样...

回答 1 投票 -1

Pandas按多列分组,得到一个多嵌套的Json。

我有一个数据框,看起来如下。Lvl1 lvl2 lvl3 lvl4 lvl5 x 1x 3xx 1 "text1" x 1x 3xx 2 "text2" x 1x 3xx 3 "text3" x 1x 4xx 4 "text4" x ...

回答 1 投票 0

col2

我有一个数据框,我用下面的表格格式表示。原始数据框的大小要大得多,因此我不能对每行进行循环。 col1

回答 1 投票 0

当通过 pandas.groupby.agg 循环一个单词时,如何忽略它的其他实例?

我有一个代码(见下图),用来匹配每个位置的单词出现次数。我的问题是,它读取了这个词的所有实例。例如:这就是我希望它做的,但代码......。

回答 1 投票 0

使用groupby获取分组中最大计数的行。

如何在pandas数据框中找到计数列的最大值,在按['Sp','Mt']列进行分组之后?例子1:下面是一个数据框,我通过['Sp','Mt']进行分组。Sp ...

回答 11 投票 232

在pandas中的get dummies中获取分类值的频率。

我在这里实现了一个热编码的数据版本Cluster_Size Hardware_type 1.0.4 3 Aplha,Alpha,Aplha 1.0.2 3 Aplha,Beta,Aplha 1.0.9 3 ...。

回答 1 投票 1

使用 pandas 中的分组 .agg 计算加权平均值

我想使用 pandas 中的 .agg() 函数按组计算数据集中一列的平均值和另一列的加权平均值。我知道一些解决方案,但它们是......

回答 5 投票 0

在pandas中,如果一列数据相同,我如何合并行,并有效地改变合并列上另一列的值?

我试图合并行,如果某些列的值是相同的。我一直在使用groupby第一和替换数据的值的列基于特定的条件。我想知道是否有一个 ...

回答 1 投票 0

在Python中对数据框中的和值和均值进行滚动。

我有这样的输入df import pandas as pd df = pd.DataFrame([[0,'B','A',1,0],[1,'B','C',0,0],[2,'A','B',3,2],[3,'A','B',5,2],[4,'A','C',2,1],[5,'B','A',0,1],[6,'C','B',5,5]],columns=['events','。

回答 1 投票 -1

使用groupby()和mean()时,没有数字类型的集合。

我正试图确定流失率。如果我试着用.size()来执行,它可以工作。但如果我用.mean()来写,就不行了。我不明白为什么它不能工作,因为我需要找出...。

回答 2 投票 1

我成功地从数据框架中的一列中返回了一个计数,但当我试图将结果导入到一列中时,却得到了NaN值。

我是一个新的ArcGIS API for Python,我试图创建一个工具,使用Notebook在ArcGIS Pro 10.5,将重新设计一个表(csv文件)。数据框的标题是data_df,我需要得到一个计数......

回答 1 投票 0

如何根据其他数据框架的条件放弃一个pandas组。

我有两个数据框,看起来像这样 df1 = 名称颜色 0 John Blue 1 John Red 2 Lucy Green 3 Lucy Blue 4 Max Blue 2 Max White 和 df2 = 名称值 0 John 15 1 ... ...

回答 1 投票 0

对某一列进行总结,让这一列打印出来,而不是全部?

我是python数据分析的新手,如果问题简单化了,我很抱歉,我正在用groupby方法总结数据,以得到每年的零件总数,我已经得到了答案,但是... ...

回答 1 投票 0

用python绘制YoY价格的相关性。(绘制Dataframe行的相关性)

在试图用Python绘制一个DataFrame的YoY相关性的背景下。问题是如何得到代表每对变量 "AAPL"、......的3对相关系数。

回答 1 投票 1

如何定位一个基于多个变量的数据框的子组,并在原数据框中只替换该子组的值?

我对Python很陌生,我在做下面的工作时遇到了一些麻烦。我有一个数据框架,我不得不根据不同的变量进行分组,以便分析数据。对于这个分析,我...

回答 1 投票 0

groupby()和第二个变量

iris.groupby('species').describe() 我在上面使用这段代码,它为我提供了一个按物种分组的所有变量的摘要。我只是想看一个变量的总和,我试了这个代码......

回答 1 投票 0

将两个数据框与两个共同的列组合起来--python [replicate] 。

我有两个数据框,df1 JobId WorkOrderNo TradeName TradeMasterId TechnicianId Rating 0 10112 samsung10112 Plumbing 1074 NaN NaN 1 ... ...

回答 1 投票 0

(pandas)我想在groupby处添加到count,percent。

我做的路csv文件的和分组2头在csv文件,所以我想对方计数约1头值和百分比总数和添加数据框架有很多数据在test.csv ==例子=...。

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.