pandas-groupby 相关问题

用于根据给定条件将变量分组在一起。并且仅用于与“pandas”库相关

使用python-pandas groupby-aggregate函数获取值

所以我有一个像这样的数据框:Date Forward_Date ABCD Amount 2010-01-01 2010-02-01 aaaa 20 2010-01-01 2010-03-01 bbb ...

回答 1 投票 0

更改熊猫中多索引Groupby对象中的数据

我正在尝试更改下面的Groupby对象中的数据,以设置dff = pd.DataFrame({'country':['US','US','UK','UK','FR' ,'FR'],'type':['A','B'] * 3,'sales':[100,200,100,100,50,10]})grouped = ...

回答 1 投票 0

熊猫:以两列为一组创建标题分组列

我正在学习有关Multiindex,groupBy,turples的知识,阅读有关Stak Overflow,Google搜索和Youtube教程的类似问题。陷入一个复杂的问题。如何将一些未知的分组...

回答 1 投票 0

从python熊猫中给定的总范围中计算平均总范围?

在此工作表中,我需要添加一列Av。 TR和我想计算平均TR。对于平均TR计算:-前10天为参考。因此,对于第10天TR为:-平均TR =第一个...的平均值...

回答 1 投票 0

将布尔值和数值混合使用大熊猫GroupBy

如何将pandas groupby应用于数值和布尔值的列?我想对数字列求和,并且希望布尔值的聚合为任意值,如果存在...

回答 1 投票 0

使用熊猫计算头对头统计数据

我有一个数据帧,看起来像这样:home_team away_team score home_goals away_goals冠军1阿森纳切尔西3-0 3 0阿森纳2曼城阿森纳1-1 ...

回答 2 投票 2

如何根据多个列的值求和并保留其他列?

我有以下列Index(['TNVED','Product_Name','Export_Value','Import_Value','Year','Country','Region','Total_Export_XLS','Total_Import_XLS','Export_Sum', '...

回答 1 投票 0


通过对熊猫中给定的字典进行特定计算来创建新列

我具有如下所示的数据帧会话slot_num s1 1 s1 2 s1 3 s1 4 s2 1 s2 2 s3 1 s3 2 s3 3还有一个...

回答 1 投票 0

使用熊猫在计数事件时考虑所有可能的1小时时间间隔

例如,我们有此示例数据帧event_time |订单号| shopid |用户ID 2019-12-28 20:20:18 | 31075224830298 | 9466594 | 84811421 2019-12-28 21:00:00 | ...

回答 1 投票 0

在某些条件下,pandas数据框中2列的差异

我有一张这样的床单。我需要计算特定“工具”和“符号”的“当前高价”-“上一日收盘价”的绝对值。因此,我将熊猫数据框的.shift(1)函数用于...

回答 1 投票 0

基于分组条件的双重排序

具有以下df:import random random.seed(1234)sz = 100 typ = ['a','b','c'] sub_typ = ['s1','s2','s3','s4 '] ifs = ['A','D'] col_sort = np.random.randint(0,10,size = sz)col_val = np...。

回答 1 投票 0

获得关于2个分组的数据帧行的最大计数

我有一个数据帧(df),希望获得有关“ COUNTRY”和“ CONDITION”列的最大数量的“ NCT_ID”(不仅是唯一值,而是每次出现)。这样,对于“ ...

回答 2 投票 0

如何使用熊猫来获取特定行?

我知道大熊猫可以从头或尾获取数据:data = data.head(100)data = data.tail(100)如果我想从第20行到第30行获取数据,该怎么办:像这样的任何函数:data =数据。(来自行...

回答 2 投票 0

Pandas:根据分组总和结果与另一列中的值进行比较的方式,修改每个组中最后一个单元格的值

抱歉,标题有点混乱。我确实缺乏用语言来描述特定熊猫挑战的方式。这个问题可以用下面的例子说明:我有一个包含3个字段的数据框:...

回答 1 投票 1

如何对熊猫数据框进行切片以获取所需的结果

我正在Jupyter中解决此问题,在这里我必须获得理想的结果。初始DataFrame是:print(df1)df2 = pd.DataFrame({'custID':[1,2,3,4],'cust_age':[20,35,50,85]},...

回答 1 投票 0

Pandas groupby基于来自另一列的条件

我有一个df,例如下面的示例,我正在寻找标识在给定时间段内发送相同文本的用户,例如<= 60分钟:user = [1,2,3,4,5 ,6]文字= ['...

回答 2 投票 0

如何根据组值计数填充数据框中的缺失值?

我有一个带有2列的Pandas DataFrame:Year(int)和Condition(string)。在“条件”列中,我有一个nan值,我想根据groupby操作的信息替换它。进口大熊猫...

回答 1 投票 0

如何计算“整洁的”熊猫数据框中两个过滤后的变量之间的比率

我具有以下格式为“整洁”(长)的Pandas数据框:df = pd.DataFrame({'Manufacturer':['Ford','Mercedes','BMW','Ford','Mercedes', 'BMW','Ford','Mercedes','BMW','Ford','Mercedes',...

回答 1 投票 0

带有条件的百分比列

我有这个df:数据= {'A':[102,102,102,102,312,312,312],'B':[1001,1001,1001,1001,1001,1001,1001], 'C':[3005,3005,3005,3005,3005,3005,3005],'D':[2004,2004,2004,2004,...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.