pandas-groupby 相关问题

用于根据给定条件将变量分组在一起。并且仅用于与“pandas”库相关

使用索引列表从GroupBy中保留一些组。

你好,StackOverflowers!我有一个pandas DataFrame df = pd.DataFrame({ 'A':[1,1,2,1,3,3,1,6,3,5,1])。我有一个pandas DataFrame df = pd.DataFrame({ 'A':[1,1,2,1,3,3,1,6,3,5,1], 'B':[10,10,300,10,30,40,20,10,30,45,20], 'C':[20,20,20,20,15,20,15,15,15,15,15,15], 'D'... ...

回答 1 投票 0

在熊猫中产生一个平均数为20的2-40之间的随机数,作为熊猫的一列。

我有一个数据框,如下图所示 session slot_num appt_time s1 1 2020-01-06 09:00:00 s1 2 2020-01-06 09:20:00 s1 3 2020-01-...。

回答 1 投票 1

在pandas数据框中添加新的行,基于一个条件。

我有一个情况,我想在满足某个条件后添加一条新行。我的数据框架看起来像以下:ID 事件日期 1 A 2019-11-12 1 ...

回答 1 投票 0

需要根据列数据中的月份,使用pandas对数据进行分组。

我想根据1月和2月的数据进行分组。以下是我所拥有的数据集的样本。日期-计数 01.01.2019 - 1 01.02.2019 - 7 02.01.2019 - 4 ...

回答 1 投票 0

根据其他列创建表示特定值历史存在的列。

假设我有下面的df。df = pd.DataFrame({ 'A': ['a', 'a', 'a', 'a', 'b', 'b', 'b'], 'B': [False, True, False, False, False, True, False, False, True] }) df已经按A排序了(很明显)... ...

回答 2 投票 2

优化groupby agg函数以返回多个结果列

我有这样一个数据框架; import pandas as pd import numpy as np df = pd.DataFrame({ 'Client':np.random.choice(['Customer_A', 'Customer_B'], 1000), 'Product':np.random.choice( ['Guns', 'Ammo', '...

回答 1 投票 0

如何在Pandas中为同一类别的每条记录添加平均值?

我有一个数据框,我将用来训练一个模型,我希望添加一个新的特征,以摆脱一个分类特征。我有一列zip_reg,它是分类的,包含了约...

回答 1 投票 1

合并两个(或多个)"分组 "一样的查询结果表。

我有一个表是这样的:名称区域时间戳aa 10时间戳aa 12时间戳aa 22时间戳bb 11时间戳bb 11时间戳cc 11时间戳,我可以做...

回答 1 投票 0


按列表条目数过滤Pandas Dataframe,并按对子重新排列输出。

我的工作是使用df.groupby来过滤哪些ids在哪里公开分享了哪些链接,创建了如下格式的csv文件。 url id bbc.com ['183','194','101']cnn.com ...

回答 1 投票 0

当复制或分组聚合一个 pandas DataFrame 时,如何保持主次顺序?

我如何使用或操作(monkey-patch)pandas,以便在复制和groupby聚合的结果对象上始终保持相同的主序?我使用pandas.DataFrame作为数据基础设施......

回答 1 投票 1

根据groupby shift更改列的值,并创建新的列 - Pandas

我有一个数据帧,如下图所示 Session slot_num ID prob s1 1 A 0.2 s1 2 B 0.9 s1 2 B 0.4 s1 ...

回答 1 投票 0

通过使用pandas移动唯一的值来导出结束日期。

我有一个数据框,如下图所示 df = pd.DataFrame({'subjectID' :[1,1,1,1,1,1,1,2,2],'start_date': ['10302006 08:04','10302006 08:04','11302006 11:01','12302006 02:04','02132007 07: ...

回答 1 投票 0

如何在Pandas中获得两列的组合?[重复]

我有一个数据框架,包含了专业和调查中使用的问卷中的问题。我想总结一下我们哪个专业用的是哪份问卷,但是我们有类似 ...

回答 1 投票 0

潘达斯每一个子组只需枢轴转到一行

给定数据结构如下 从io导入StringIO导入pandas作为pd data = StringIO(""" person,q,a 1,q1,Yes 1,q2,No 1,q3,Yes 1,q1,No 1,q2,No 1,q3,Yes 2,q1,Yes 2,q2,Yes 2,q3,Yes 3,q1,No 3,q2,。

回答 1 投票 0

对多列进行分组,并通过考虑每列的开始和结束为每列赋值(Pandas)。

我有一个数据框,看起来是这样的df1 v w x y 4 0 1 a b 5 0 1 a a _________________ 6 0 2 a b _________________ 2 0 3 a ...

回答 1 投票 0

创建一个表,显示数据框的分组列中是否包含列表。

给定以下数据: data = pd.DataFrame( dict( source=["file1", "file1", "file2", "file2"], variable=["shipp", "carrr", "shipp", "bikee"], ) vals = pd.Series(["ship", "...

回答 1 投票 1

返回一个组中所有唯一的集合

问题是这样的。假设我们有一个pandas df,可以用以下方法生成:month=['dec','dec','dec','jan','feb','feb','mar','mar'] category =['a','a','b','b','a','b','b','b','b'] ......

回答 1 投票 2

对pandas的行和列进行求和,并新建一列。

我有一个熊猫数据框架是这样的:日期城市确认0 2020-03-12 弗洛里亚诺波利斯2 1 2020-03-13 弗洛里亚诺波利斯2 2 2020-03-13 儒因维尔1 3 2020-03-14 弗洛里亚诺波利斯2 ...

回答 1 投票 1

Pandas,根据共同的列数据消除3个数据框之间的差异。

我有3个包含传感器数据的数据帧。在进一步处理数据之前,我正在对数据进行一些清理。我基本上需要保留3个数据集之间的共同时间数据,并丢弃行 ...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.