pandas-groupby 相关问题

用于根据给定条件将变量分组在一起。并且仅用于与“pandas”库相关

(协助/指导)如果数字带有美元符号,如何计算数字?以及如何根据其他变量将它们分组在一起?

[这是我正在使用的数据:https://raw.githubusercontent.com/justmarkham/DAT8/master/data/chipotle.tsv我想要做的是将item_price转换为数字,以便可以对其进行数学运算,组...

回答 1 投票 0

如何将行按实际包含数据点的列进行分组?

我什至不知道groupby是否是用于此目的的正确函数。有点难以理解,所以下面将包括我的数据帧的屏幕快照:屏幕快照基本上,这个数据帧的太多了...

回答 1 投票 0

基于熊猫另一列中值的范围的一列总内容

我正在根据给定列中值的范围来汇总数据框的内容。我的df如下所示:最小最大名称1 5 ['a','b'] 0 5 ['d'] 6 8 ['a','c'] 3 ...

回答 1 投票 2

如何通过最大的计算获得熊猫组中的其他列名信息?

我正在使用六个模糊比来比较成对的字符串,我需要输出每对字符串的前三名得分。这行工作:final2_df = final_df [['nameHiringOrganization','mesure',...

回答 1 投票 2

如何使用熊猫中的公共列查找多列的平均值

如何计算带有'count'列的所有列的平均值。我在下面的代码中创建了一个带有随机生成值的数据框。将pandas导入为pd,将numpy导入为np df = pd...。

回答 1 投票 0

如何在不重置熊猫索引的情况下获得列总数

以及我要显示的方式类似于此ComoQty DocDate ImportType ForeignType April Export Costal 901637.68 Foreign ...

回答 1 投票 0

groupby,具有python可视化功能

[我的数据框看起来像-状态资料-我希望数据框看起来像-状态...

回答 1 投票 0

在数据帧的每个分组之间插入空白行,但仅显示第一个标头

以下@jezrael提供的代码显示空白行和每个分组数据的标题= {'MARKET_SECTOR_DES':['A','A','B','B','B','B' ],'count':[10,9,20,19,18,17] ...

回答 1 投票 0

如何通过键保存groupby结果?(熊猫通过Groupby result KeyError应用函数)

添加:我有一个更好的问题。我可以用密钥(在这种情况下为“响应者”)保存分组结果吗? EAR MAR圆度MOE响应者...

回答 1 投票 0

如何基于熊猫数据框中的给定索引提取下5条记录

我想在特定索引之后获取接下来的5条记录。例如,这是我的数据帧:ID名称代码1 java 45 2 python 78 3 c 65 4 ...

回答 3 投票 1

丢弃大熊猫内的最大元素

我正在尝试通过删除索引级别内最大的元素来删除数据中的异常值。以pd索引= pd.MultiIndex.from_product([['A','B'],range(3)],names = ['Letters,'Numbers ......

回答 1 投票 0

用数字和字符串重新采样时间序列的集合

我具有以下具有时间序列数据的数据帧:将pandas作为pd导入,将numpy作为np test_dict = {'时间':['2018-01-01 00:00:00 + 00:00','2018-01-01 00:15:00 + 00:00','2018-01-01 00:30:00 + 00:00',...

回答 1 投票 0

Pandas`groupby.aggregate`在`df.index.duplicated()`

场景。假设pd.DataFrame是从外部源加载的,其中一行是来自传感器的一行。索引是DateTimeIndex,其中某些行具有df.index.duplicated()== True。这实际上是...

回答 1 投票 0

如何在大熊猫中旋转日期?

我有一个看起来像这个日期的df,时间长于1/2/12 30 30 2/2/12 31 12 2/2/12 30 29 2/2/12 30 30 3/2/12 31 21 3 / 2/12 31 10 3/2/12 nan nan .... 5/15/20 31 21 ...

回答 1 投票 0

每组具有n个最大值的行的过滤器

上下文,我想为每个团队提供包含前三名得分手的数据框行。在我的脑海中,它是Dataframe.nlargest()和Dataframe.groupby()的组合,但我不是...

回答 3 投票 0

每个时间间隔拆分一个数据帧

我有以下格式的数据帧:时间戳,名称,年龄2020-03-01 00:00:01,nick 2020-03-01 00:00:01,john 2020-03-01 00:00:02 ,nick 2020-03-01 00:00:02,john 2020-03-01 00:00:04,peter 2020-03-01 ...

回答 1 投票 0

根据对列中每个不同的值都有特定条件的行来计算Pandas Dataframe中的perc

我有一个数据帧,其样本值如下所示:'co1 col2 A ['1','2','er'] A [] B ['3','4','ac'] B ['5 '] C []`我想计算总数的百分比...

回答 1 投票 0


如何从用于存储数据的for循环中动态创建不同的数据帧

我有如下代码。 df2.index中ind的ind1 = 0:df3 = df1 [df2.iloc [ind1,2:]。dropna()。tolist()] df3.insert(0,'Col',df2.loc [ind,1] )...

回答 1 投票 1

pandas:如何通过在DataFrame中分组来获取行总和?

我是Data Science的新手,目前正在使用Jupyter笔记本电脑上的Pandas库。对不起,我的英语不好。 A,1,5,9 B,2,6,3 A,3,7,2 B,4,8,1如何也将上述CSV值分组...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.