pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

如何使用multiindex数据框创建seaborn回归图?

我有时间序列数据,在(年,月)上进行多索引,如下所示:print(df.index)print(df)MultiIndex(levels = [[2016,2017],[1,2,3,4, 5,6,7,8,9,10,11,12]],标签= [...

回答 2 投票 1

根据yaml文件中的某些规则过滤pandas df

我有一个配置yaml文件,应该由客户使用,并且易于编辑。在yaml文件中有一些规则:变量:used_often:['good','bad',3]规则: - ...

回答 1 投票 0

无法从带有Pandas的CSV标头中删除空格

我正在尝试重命名具有空格的csv中的标题。使用Pandas API参考中的这些行不起作用。标题仍然有空格而不是下划线。进口......

回答 3 投票 0

为每个Excel工作表创建框和胡须图

我对python / pandas / matplotlib的世界非常陌生,但我最近一直用它来制作盒子和胡须图。我很好奇如何使用...为每张纸创建一个盒子和胡须图

回答 1 投票 0

For Loop - TypeError:必须是str,而不是int [duplicate]

我试图创建一个for循环有点困惑。我有一个带有一些Tweets信息的数据框,我需要2个列用于循环:tweet_id和expanded_urls。我有一些 ...

回答 1 投票 0

移动列位置时合并两个数据帧[重复]

我有一个名为df1的数据帧:0 103773708 68.50 103773718 57.01 103773730 30.80 103773739 67.62我有另一个名为df2的数据:0 103773739 37.02 ...

回答 3 投票 1

使用带有块的pandas读取大json数据集

我想读一个6gb大小的json(我还有1.5gb的另一个),我试着用pandas正常阅读(只用pd.read_json),显然内存已经死了。然后,我尝试使用chunksize param,如:...

回答 1 投票 0

处理多元线性回归Python中的分类和数值变量

所以我已经使用sklearn中的LinearRegression在Python中执行了多元线性回归。我的独立变量都是数字的(我的依赖变量也是如此)但是现在我想......

回答 1 投票 0

从具有重复列的2行创建多索引

我有一个excel文件,我用pandas读取并转换为数据帧。以下是数据帧的示例:| | salads_count | salads_count | salads_count | carrot_counts | ...

回答 1 投票 1

Pandas如何解析df.agg中name指定的函数

我正在学习Pandas和Numpy,目前正在阅读本教程的这一部分。我完全是Python的新手,所以这可能是一个基本的初学者问题。鉴于此数据框:df = pd ....

回答 1 投票 0

计算列中大于x但小于y的元素数

我试图计算列'xyz'中小于x但大于y的元素数。 a = df ['xyz'] df [1/3 <a <2/3] .count()然而,这给了我:ValueError:真相......

回答 3 投票 1

连接熊猫的选定列,同时忽略列中的空格

我有一个看起来像这样的数据框。钥匙A1 A2 A3 BX CX DX 1 X1 Y1 B1 C1 D1 2 X2 Z2 B2 C2 D2 3 X3 B3 C3 D3 4 X4 B4 C4 D4 5 B5 C5 D5我试图形成一个......

回答 1 投票 1

什么是更快,更Pythonic的方式来读取CSV并从中创建数据框?

输入:包含50,000行的CSV;每行包含910列值0/1。输出:运行CNN的数据帧。我写了一行代码逐行读取CSV。对于每一行,我分割数据......

回答 2 投票 1

在固定利率支出后,提高寻找投资组合终值的速度

我有一个与年份相对应的pd.DataFrame返回系列,固定支出率为5%。我希望在每年支出后找到结束的投资组合价值。 val_after_spending年...

回答 1 投票 1

如何使用SciKit Learn转换一次编码多个功能

我试图编码一些分类功能,以便能够将它们用作机器学习模型中的功能,目前我有以下代码:data_path ='/ Users / novikov / Assignment2 / epl -...

回答 4 投票 2

日期之间的差异np数组 - 当前日期

我试图找到Pandas Dataframe中的日期列表与当前日期之间的天数。我想创建一个新列,其中包含截止日期和当前日期之间的天数...

回答 3 投票 2

Python:平衡数据集以进行回归分析(重新排列数据集并填充空白类别)

我有一个数据集(df2),如下所示:total_n ind_n4 year city_code 9 2003 a 236 2004 a 520 54 2002 ...

回答 1 投票 1

Python无法安装Pandas lib

我正在使用亚马逊linux机器。当我尝试使用python 3.4安装Pandas lib时,我有这个错误

回答 1 投票 -3

如何检查pandas系列是否为空?

如何检查pandas系列是否为空?我试过这个:如何检查pandas DataFrame是否为空?但似乎系列没有属性'isempty'。

回答 5 投票 8

如何有选择地删除重复? [关闭]

我在这里有这个datafame图像并执行此代码:unique_records_for_cols = terceros_prepared3_df.drop_duplicates(subset = ['id'])这里删除了重复项图像但是......

回答 1 投票 -1

© www.soinside.com 2019 - 2024. All rights reserved.