pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

For Loop - TypeError:必须是str,而不是int [duplicate]

我试图创建一个for循环有点困惑。我有一个带有一些Tweets信息的数据框,我需要2个列用于循环:tweet_id和expanded_urls。我有一些 ...

回答 1 投票 0

移动列位置时合并两个数据帧[重复]

我有一个名为df1的数据帧:0 103773708 68.50 103773718 57.01 103773730 30.80 103773739 67.62我有另一个名为df2的数据:0 103773739 37.02 ...

回答 3 投票 1

使用带有块的pandas读取大json数据集

我想读一个6gb大小的json(我还有1.5gb的另一个),我试着用pandas正常阅读(只用pd.read_json),显然内存已经死了。然后,我尝试使用chunksize param,如:...

回答 1 投票 0

处理多元线性回归Python中的分类和数值变量

所以我已经使用sklearn中的LinearRegression在Python中执行了多元线性回归。我的独立变量都是数字的(我的依赖变量也是如此)但是现在我想......

回答 1 投票 0

从具有重复列的2行创建多索引

我有一个excel文件,我用pandas读取并转换为数据帧。以下是数据帧的示例:| | salads_count | salads_count | salads_count | carrot_counts | ...

回答 1 投票 1

Pandas如何解析df.agg中name指定的函数

我正在学习Pandas和Numpy,目前正在阅读本教程的这一部分。我完全是Python的新手,所以这可能是一个基本的初学者问题。鉴于此数据框:df = pd ....

回答 1 投票 0

计算列中大于x但小于y的元素数

我试图计算列'xyz'中小于x但大于y的元素数。 a = df ['xyz'] df [1/3 <a <2/3] .count()然而,这给了我:ValueError:真相......

回答 3 投票 1

连接熊猫的选定列,同时忽略列中的空格

我有一个看起来像这样的数据框。钥匙A1 A2 A3 BX CX DX 1 X1 Y1 B1 C1 D1 2 X2 Z2 B2 C2 D2 3 X3 B3 C3 D3 4 X4 B4 C4 D4 5 B5 C5 D5我试图形成一个......

回答 1 投票 1

什么是更快,更Pythonic的方式来读取CSV并从中创建数据框?

输入:包含50,000行的CSV;每行包含910列值0/1。输出:运行CNN的数据帧。我写了一行代码逐行读取CSV。对于每一行,我分割数据......

回答 2 投票 1

在固定利率支出后,提高寻找投资组合终值的速度

我有一个与年份相对应的pd.DataFrame返回系列,固定支出率为5%。我希望在每年支出后找到结束的投资组合价值。 val_after_spending年...

回答 1 投票 1

如何使用SciKit Learn转换一次编码多个功能

我试图编码一些分类功能,以便能够将它们用作机器学习模型中的功能,目前我有以下代码:data_path ='/ Users / novikov / Assignment2 / epl -...

回答 4 投票 2

日期之间的差异np数组 - 当前日期

我试图找到Pandas Dataframe中的日期列表与当前日期之间的天数。我想创建一个新列,其中包含截止日期和当前日期之间的天数...

回答 3 投票 2

Python:平衡数据集以进行回归分析(重新排列数据集并填充空白类别)

我有一个数据集(df2),如下所示:total_n ind_n4 year city_code 9 2003 a 236 2004 a 520 54 2002 ...

回答 1 投票 1

Python无法安装Pandas lib

我正在使用亚马逊linux机器。当我尝试使用python 3.4安装Pandas lib时,我有这个错误

回答 1 投票 -3

如何检查pandas系列是否为空?

如何检查pandas系列是否为空?我试过这个:如何检查pandas DataFrame是否为空?但似乎系列没有属性'isempty'。

回答 5 投票 8

如何有选择地删除重复? [关闭]

我在这里有这个datafame图像并执行此代码:unique_records_for_cols = terceros_prepared3_df.drop_duplicates(subset = ['id'])这里删除了重复项图像但是......

回答 1 投票 -1

检查pandas [duplicate]中的dataframe列中是否包含某个值

我试图检查python列中是否包含某个值。我正在使用df.date.isin(['07311954']),我不怀疑它是一个很好的工具。问题是我有超过350K的行和......

回答 3 投票 15

在pandas数据帧中为不同的行添加不同的类别

我有三个包含数百行的文档。我想将它们添加到具有不同名称类别的数据框中。我正在尝试使用以下代码。但是我虽然能够将文件合并到......

回答 1 投票 0

在dict中查找给定键的公共值,其中每个值都是一个集合

我有两个由csv文件创建的dicts(参见下面的文件):a_data = {'78567908':{'26 .01.21','02 .03.24','26 .01.12','02 .03.01','04 .03.03 ','01 .01.13','01 .01.10','26 .01.17'},'85789070':{...

回答 1 投票 0

Py2exe中的AttributeError

我使用py2exe使我的py文件可执行。我的setup.py如下:来自distutils.core导入设置导入py2exe安装程序(windows = ['main.py'])当我尝试运行main.exe时,我收到一个错误,是...

回答 2 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.