pandas-groupby 相关问题

用于根据给定条件将变量分组在一起。并且仅用于与“pandas”库相关

如何使用熊猫查找具有男性和女性优势的所有职业列表

我必须列出每个职业的男性和女性总数,并检查该职业是男性还是女性为主。这是数据帧:user_id年龄性别职业邮政编码0 1 ...

回答 1 投票 0

矢量化熊猫中的条件更新操作

我的第一个问题在这里!我正在寻找有关如何对熊猫数据框进行矢量化处理的帮助。我可以将问题简化为一个包含三列的数据框,该列的值是...

回答 1 投票 0

如何在熊猫数据框中创建新的总计(sumif)列?

我想为厨房创建一个简单的统计数据,为此,我要有一个df /桌子,如下所示:餐食成分how_much in_fridge火腿和鸡蛋火腿8 6火腿和鸡蛋...

回答 2 投票 0

Pandas Upsample将多索引每月数据重新采样为多索引每周数据?

我在一个看起来像这样的DataFrame中有2年的数据价值:In [117]:df Out [117]:Str%Val%Vol%状态位置日期...

回答 1 投票 1

Pandas列并选择正确的值

我有一个熊猫数据框,看起来像:Book_Name Book_Ids国家/地区Book_A [123] [美国] Book_B [4670,1122] [加拿大,美国] ...

回答 1 投票 0

如何通过熊猫遍历另一列的列值?

我想在X列上使用Z的值。但我想以这种方式工作:Z列的0索引值将被填充为X列的索引1。我想将值从1转换为100索引。...

回答 1 投票 0

如何合并apply groupby在talib.BBAND的熊猫中返回的元组

所以让我们说我有一个数据框,它是这样创建的,并具有3个产品A,B,C df = pd.DataFrame({'type':['A','A','B',' B','C','C'],'x':[1,2,3,4,5,6]})您可以打印并看到它们的外观...

回答 2 投票 1

[在Python中使用Pandas Groupby在系列中按标签分组

可能是一个相当初学者的问题,但是只是学习如何在Python中使用Pandas。我想使用熊猫来进行分组,其中包括不在数据集中的分组。说我有以下...

回答 3 投票 2

如何将大熊猫中的apply groupby返回的元组合并回数据框

所以让我们说我有一个数据框,它是这样创建的,并具有3个产品A,B,C df = pd.DataFrame({'products':['A','A','B',' B','C','C'],'x':[1,2,3,4,5,6]})可以打印并查看...

回答 1 投票 1

Pandas Upsample将每月数据重新采样为每周数据?

我在一个看起来像这样的DataFrame中有2年的数据价值:数据具有三个多索引['State','Location','Date']。对于每个州和地区,该数据每月都会提供...

回答 1 投票 0

Pandas groupby并应用自定义函数比较两列以更改另一列

我有一个数据框,需要按ID分组,然后在这些组中,比较A和B列以更改列C。这是我的代码:def alter_C(row):if row ['A']。shift(1 )== row ['B']:...

回答 1 投票 1

Pandas groupby并应用自定义函数比较两列以更改另一列

我有一个数据框,需要按ID分组,然后在这些组中,比较A和B列以更改列C。这是我的代码:def alter_C(row):if row ['A']。shift(1 )== row ['B']:...

回答 1 投票 0

如何获得每个组中的最高价值?

我是Pandas的新手,我有一个看起来像这样的数据集。 s_name时间p_name数量A 12/01/2019 ABC 1 A 12/01/2019 ABC 1 A 12/01/2019 DEF 2 A ...

回答 1 投票 -1

Pandas Groupby在列的特定值上

我在这里尝试汇总此样本数据:票证ID用户日期类别1926 a 1/1/2020 cat_7 1947 a 1/1/2020 cat_6 1901 c 1/2 / ...>]

回答 1 投票 1

与其他日期时间列添加列值,以熊猫为单位的分钟级别

我有一个数据帧,如下所示ID ID_appt_time service_time 1 2020-01-06 09:00:00 22 2 2020-01-06 09:30:00 15 1 2020-01-08 14:00:00 42 2 ...

回答 2 投票 0

如何将DataFrames的字典转换为单个DataFrames(Python,Pandas)

我有一个具有4列的原始数据框(例如,我们将其称为product_id,year_month,week,order_amount)和> 50,000行。有240个单独的product_id值,并且...

回答 1 投票 0

具有不同组值的返回平均值最大值

我想通过两个组级别获取最小值,例如,按季度划分最小值组,按商店划分按季度划分最小值。并寻找是否还有其他方法可以代替表连接,正如我认为的...

回答 1 投票 1

在熊猫数据框中找到基于多列的模式

我的数据看起来像下面的设备时间戳列值D1 18/04/2020 23:59命令1 18/04/2020 23:59 Run_status 1 19/04 / ...

回答 1 投票 0

基于pandas或numpy中的列之一的值创建新行

我有一个数据框,如下所示。这是医生的约会数据。 B_ID No_Show会话slot_num Cumulative_no_show 1 0.4 S1 1 0.4 2 0.3 S1 ...

回答 1 投票 1

如何在熊猫数据框中组合均值和计数值频率?

我正在研究Tianic数据集。我正在根据幸存者的头衔以及每个头衔出现的频率检查幸存者的频率。 train [['Title','Survived']]。groupby(['Title'],...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.