pandas-groupby 相关问题

用于根据给定条件将变量分组在一起。并且仅用于与“pandas”库相关

在熊猫群中显示较低级别,由

我对数据中的每一个组进行汇总统计,同时使用多个分组标准。数据: import pandas as pd d = {'Fruit': ['苹果', '苹果', '苹果', '橙子', '橙子'], '城市': ...

回答 1 投票 0

有什么方法可以将多个字符串连接起来进行分组?

我有以下df。姓名 角色 公司 [其他列] John Admin GM John Director Kodak John Partner McDonalds Mark Director Gerdau Mark Partner Kibon 我想把它变成: ...

回答 1 投票 0

date

我的数据框架ID如下

回答 1 投票 0

寻找一个更快的代码来实现多列不同窗口滚动函数的均值()函数。

谁能建议一个更好的更短的方法来应用相同的给定的下面的代码。给定的代码实现了四列,用不同的窗口滚动功能。现在我想...

回答 1 投票 1

找出每个数据框行的前3个值。

我想从monthly_return数据框架中找出每个月回报率最高的前3只股票。结果应该是这样的。数据: !"curl -L -s -o open_price.csv https:/...

回答 1 投票 1

组别:应用量化替换

我试图使用python的groupby、apply、where和quantile来替换低于50%分位数的值,用NaN替换 "date "组,但是它似乎在单元格中返回列表。如何...

回答 1 投票 0

如何在pandas中使用groupby计算过去14天的平均值?

我想能够计算菲律宾这里每个城市的Covid-19病例的增长率。我使用的是卫生部的公共病例数据集,其中包含病例ID、病例发生的日期......

回答 1 投票 0

熊猫的分组和枢轴

我有以下pandas数据框架 id category counts_mean 0 8 a 23 1 8 b 22 2 8 c 23 3 8 d 30 4 9 a 40 5 9 b ...

回答 1 投票 -1

如何在多索引列中使用groupby

我有一个多维数据框,它是从excel表中读取的,最后看起来就像下面所示的输入表。df_1 = pd......。

回答 1 投票 3

用if语句滚动过去n天的平均数。

我有以下数据帧: entry_time_flat route_id time_slot duration n_of_trips 2019-09-02 00:00:00 1_2 0-6 10 29 2019-09-04 00:...

回答 1 投票 0

我无法对数据框架进行分组。我想分组,并设置索引为ID。

weather = pd.read_csv('dataC2A2_dataBinnedCsvs_d400fb441e62df2d58994928907a91895ec62c2c42e6cd075c2700843b89.csv') weather.Date = pd.to_datetime(weather.Date) weather = weather.sort_values(by = ['...])

回答 1 投票 -1

颠倒各组元素的顺序

假设我有一个像这样的DataFrame: import pandas as pd df = pd.DataFrame({'a': [1,1,1,1,2,2,2,2], 'b': [1,2,3,4,5,6,7,8]}),它看起来像这样 a b 0 1 1 1 1 2 2 1 3 3 1 4 4 2 5 5 2 ... ...

回答 1 投票 0

回答 1 投票 3

pandas.core.base.DataError: 在只有数字的数据框架中,没有数字类型的集合。

我有一个csv文件是这样的:year,value 1897.386301369863,0.6 1897.3890410958904,1.1 1897.3917808219178,0.0 1897.3945205479451,8.3 1897.3972602739725,3.3 1897.4,6.7 1897.4027397260274,0.6 1897...。

回答 1 投票 0

如何利用pandas找到多个员工的正向调查连胜率?

我有以下的数据框架。Data = {'Name':['Ramu', 'Aana', 'Rafi', 'Ramu', 'Aana', 'Ramu', 'Aana', 'Rafi', 'Ramu', 'Aana', 'Rafi','...

回答 1 投票 1

对分组数据框进行排序

我有一个数据框,其中有列['姓名','性别','出生','年份']。然后我根据名字对数据框进行分组,创建了2个新的列 "max "和 "total"。trendy_names['max']=trendy_names...。

回答 1 投票 0

如何通过数据框列中的正负数范围建立一个窗口?

我想在每个正负范围内都有平均值和最大值。从下面的示例数据来看: import pandas as pd test_list = [-1, -2, -3, -2, -1, 1, 2, 3, 2, 1, -1, -4, -5, 2 ,4 ,7 ...。

回答 1 投票 0

如何在各组上应用函数,并保持数据框的形状不变。

我有一个带类别的数据框,我希望通过类别变量对其进行分组,然后应用一些函数f(x),其中x是一个组,并返回一个与该组形状相同的2D数组。我希望...

回答 1 投票 0

当按多列和缺失的数据进行分组时,在Pandas的groupby输出上进行循环。

在数据缺失的情况下,按多列分组:data = [['猎鹰', '圈养', 390], ['猎鹰', 无, 350], ['鹦鹉', '圈养', 30], ['鹦鹉', '野生', 20]] df = pd.DataFrame(data, columns = ...。

回答 1 投票 0

如何获取多列的groupby中某一级别下的第一组?

我对第2级的第一组感兴趣,想得到与之相关的所有行。请看下面的例子。col1 col2 col3 col4 1 34 绿色 10 黄色 20 ...

回答 1 投票 2

© www.soinside.com 2019 - 2024. All rights reserved.