多索引(也称为分层索引)允许在二维表格结构中操纵更高维数据。
pandas函数用于查找多级索引表中不同索引级别的列数之和。
如何在多级索引表中求出不同索引级别的数值之和,并在索引中以求和行的形式表示出来 例如 性别 年龄 马克斯 M. 20. 30 45 ...
我有一个名为 "keytable "的数据框架,它的特点是由 "月"、"日 "和 "小时 "组成的多索引。我想保留这个多索引,同时创建3个新的列,分别是 "月"、"日"......。
我有一个巨大的多索引数据框架。我希望根据多索引的内容部分创建新的列。我的情况是这样的: arrays = [['bar', 'bar', 'bar', 'baz', 'baz', 'foo', 'foo','...
我试图添加一列新的小计和一列最后的总计。例如,df = pd.DataFrame({"A": ["foo", "foo", "foo", "foo", "foo", "bar", "bar", "bar", "bar"], "B"... ...
假设我有下面的多索引数据框架: arrays = [np.array(['bar', 'bar', 'bar', 'bar', 'foo', 'foo', 'foo', 'foo']), pd.to_datetime(['2020-01-01', '2020-01-02', '2020-01-03', '2020-...
我想对一个多索引的datafame进行pivot,但失败了。传递值的形状是(3,4), 指数意味着(3,2) 代码: import pandas as pd df = pd.DataFrame({ 'foo': [1,2,3], 'bar':[4,5,6], ...
在pivot_table后对MultiIndex列进行排序。
我有以下数据框:df = pd.DataFrame({'mean':np.arrange(0,12), # effect size "difference" 'lo':np.arrange(12,24), # bca_low 'hi':np.arrange(24,36), # ...
我想移动多指数数据框架中的一列,以便计算一个具有滞后独立变量的回归模型。由于我的时间序列有缺失的值,我只想把前一天的值 ...
我有一个多索引的数据框架 我用掩码将其分组。time = pd.date_range('2000-05-01', freq='24H', periods=10) mult_index = pd...。
我正在努力解决一些我认为相当琐碎的问题。我有一个电子表格,提供的数据格式如下,不幸的是,这不能改变,这是唯一的方式,它可以...
我有一个多维数据框,它是从excel表中读取的,最后看起来就像下面所示的输入表。df_1 = pd......。
Pandas pivot_table,具有多索引和重复字符值。
我想把一个数据框像id1 id2属性值1 2 p v1 1 2 p v2这样的数据框旋转成id1 id2 p 1 2 v1 &v2 我的代码到目前为止是 import pandas as pd df = pd.DataFrame(....
我有一个(很长的)pandas Series,它有一个4层的MultiIndex,类似于: objs = ['car', 'bicycle', 'plane'] trials = ['trial A', 'trial B'] moves = [f'mov{i}' for i in range(1,11)] multi = pd...。
我对第2级的第一组感兴趣,想得到与之相关的所有行。请看下面的例子。col1 col2 col3 col4 1 34 绿色 10 黄色 20 ...
源数据: pd.pivot_table(ceshi, values=['num1', 'num2'], index=['date'], columns=['c'], aggfunc={'num1': np.sum, 'num2': np.sum}, fill_value=0) 如何转换为?
根据现有的DataFrame是否出现在列表中,从现有的DataFrame中创建一个新的pandas DataFrame。
我希望能够将一个有多索引的大型DataFrame,根据索引是否出现在列表中,创建两个新的索引。举个例子,假设我有一个DataFrame,它有一个 ...
我有以下df2:df2 Out[94]: 符号 ADANIPORTS.NS ASIANPAINT.NS ... ... WIPRO.NS ZEEL.NS 日期... 2015-06-15 NaN ...
我有以下pandas数据框架df = pd.DataFrame(data = { 'item': ['red','red','red','blue','blue'], 'dt': pd.to_datetime(['2018-01-31', '2018-02-28', '2018-03-31', '2018-01-31', '2018-...
如果一个特定的列只包含该ID的NaAs,则放弃多索引数据框的ID。
我有一个多索引数据框,看起来像这样(但有超过20k行和大约100列):x1 x2 x3 时间 ID 1 1 1 2 NaN 2 1 1 2 3 1 2 1 2 NaN 2 ... ...
用Python pandas将一个带有逗号值的字符串变成多层索引的各个行。
我有一个Pandas数据框架,目前看起来是这样的:df = pd.DataFrame({'Film' : ['James Bond: Spectre', 'Avengers: Endgame'], 'Year' : [2015, 2019], 'Director(s)': ['...