pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

如何在pandas中的数据框中存储数据

我有一个时间序列数据,比如机器读数如下(Say)df ['machine_r'] = [1,2,1,5,3,4,5,1,2,3,4,5,7,8 ,1,2 .....如何更改数据框如下如果数据框中的数据<= 25 ...

回答 1 投票 1

我可以使用pandas附加到压缩流吗?

我知道通过将compression ='gzip'参数传递给pd.read_csv(),我可以将DataFrame保存到压缩的CSV文件中。 my_df.to_csv('my_file_name.csv',compression ='gzip')我也知道如果我......

回答 1 投票 6

结合两列pandas数据帧

我有15个csv文件,其中一列代表年份。问题是year列在某些文件中被命名为'year'而在另一个文件中被命名为'year_'。所以我有两个相同的列......

回答 3 投票 2

熊猫组由cumsum保持列

我花了几个小时试图在熊猫数据框架上做一个“累计组合”。我已经查看了所有stackoverflow的答案,并且令人惊讶的是,它们都无法解决我的问题(非常基础)......

回答 2 投票 6

Groupby,手段和标准

我是python的新手...提前谢谢你!我需要分组,在一列中计算每种营养素的平均值和相应的标准品。如此:鳕鱼| Nmean | Nstd |等...对于每种营养素我...

回答 1 投票 0

在Python中填充部分数据的过去和未来数据

我已经从198x到2016年的数据累积总和,现在形式为:州年月值TN 1987 1 24410.0 TN 1987 2 24410.0 TN 1987 ...

回答 2 投票 0

pandas数据帧切片警告的副本

我对熊猫很新,并且在一大段代码中得到了臭名昭着的SettingWithCopyWarning。我将其归结为以下内容:将pandas导入pd df = pd.DataFrame([[0,3],[3,3],[3,1],[1,...

回答 1 投票 0

在索引中随机选取数据而不重复,并从中创建新列表

我的程序需要随机选择值而不重复它们。之后,程序将为它们分配随机变量。假设这是数据:[输入]数据[输出] 0 0 ...

回答 2 投票 0

如果匹配,如何合并两个数据帧并从新列中的另一列返回数据?

我有两个看起来像这样的df:df1:id 1 2 df2:id值2 a 3 b如果有一个......我如何合并这两个数据帧并仅返回新列中值列的数据...

回答 5 投票 0

在DataFrame中嵌套groupby并聚合多个列

我试图按如下方式进行嵌套groupby:>>> df1 = pd.DataFrame({'Date':{0:'2016-10-11',1:'2016-10-11',2:'2016- 10-11',3:'2016-10-11',4:'2016-10-11',5:'2016-10-12'},'股票':{...

回答 2 投票 -1

Pandas Graph Bar和Line情节问题

我试图在条形图上绘制折线图, 以便从数据框中进行分析。每次我尝试添加折线图时,右边的y轴都会变得混乱,而x上的条形图标题会...

回答 2 投票 0

将多个列添加到数据框并跳过空值

我有一个这样的数据帧:s = {'B1':['1C','3A','41A'],'B2':['','1A','28A'],'B3':[ '','','3A'],'B1_m':['2','2','2'],'B2_m':['2','4','2'],'B3_m' :['2','2','4'],'E':['0','0','0']} s ...

回答 2 投票 0

如何使用multiindex数据框创建seaborn回归图?

我有时间序列数据,在(年,月)上进行多索引,如下所示:print(df.index)print(df)MultiIndex(levels = [[2016,2017],[1,2,3,4, 5,6,7,8,9,10,11,12]],标签= [...

回答 2 投票 1

根据yaml文件中的某些规则过滤pandas df

我有一个配置yaml文件,应该由客户使用,并且易于编辑。在yaml文件中有一些规则:变量:used_often:['good','bad',3]规则: - ...

回答 1 投票 0

无法从带有Pandas的CSV标头中删除空格

我正在尝试重命名具有空格的csv中的标题。使用Pandas API参考中的这些行不起作用。标题仍然有空格而不是下划线。进口......

回答 3 投票 0

为每个Excel工作表创建框和胡须图

我对python / pandas / matplotlib的世界非常陌生,但我最近一直用它来制作盒子和胡须图。我很好奇如何使用...为每张纸创建一个盒子和胡须图

回答 1 投票 0

For Loop - TypeError:必须是str,而不是int [duplicate]

我试图创建一个for循环有点困惑。我有一个带有一些Tweets信息的数据框,我需要2个列用于循环:tweet_id和expanded_urls。我有一些 ...

回答 1 投票 0

移动列位置时合并两个数据帧[重复]

我有一个名为df1的数据帧:0 103773708 68.50 103773718 57.01 103773730 30.80 103773739 67.62我有另一个名为df2的数据:0 103773739 37.02 ...

回答 3 投票 1

使用带有块的pandas读取大json数据集

我想读一个6gb大小的json(我还有1.5gb的另一个),我试着用pandas正常阅读(只用pd.read_json),显然内存已经死了。然后,我尝试使用chunksize param,如:...

回答 1 投票 0

处理多元线性回归Python中的分类和数值变量

所以我已经使用sklearn中的LinearRegression在Python中执行了多元线性回归。我的独立变量都是数字的(我的依赖变量也是如此)但是现在我想......

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.