pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

什么是更快,(=。at),(=。loc),(。drop)或(.append)来过滤大型数据帧?

我想整理一个大约400k行的数据帧,有4列,用if语句取出大约一半的行:for a range(0,howmanytimestorunthrough):if('Primary'...

回答 1 投票 2

从嵌套字典构建数据框架的最佳方法

处理完数据后,我保存了以下结构中的组级计算(嵌套字典):{'Source1':{(1,2):{'value1': - 1.4089917877152731,'value2':0.15890127107708821},(1,3) ...

回答 1 投票 1

python pandas.column索引号到实际列名

我正在尝试处理用html(或xml.IDK)编写的xls数据我尝试这样做df = pandas.read_html(r“filename.xls”,skiprows = 0)并且它不是数据帧而只是列表。所以我做了这个df = ...

回答 1 投票 3

基于另一个变量/列的两行在数据框中生成新的变量/列

背景:我正在使用统一犯罪报告数据,按城市(地点)编制索引。我试图合并/连接2006-2016年的问题:并非所有.csv都在城市名称前面有一个州列,......

回答 2 投票 0

按索引选择MultiIndex数据框中的行而不会丢失任何级别

我想选择一个名为'Mid'的行,而不会丢失它的索引'Site'以下代码显示数据帧:m.commodity price max maxperstep Site Commodity Type Mid ...

回答 3 投票 5

python pandas groupby复杂计算

我的数据帧df包含列:a,b,c,d。我想通过a对数据进行分组并进行一些计算。我将在R中提供这个计算的代码。我的主要问题是如何在熊猫中做同样的事情? ...

回答 1 投票 -2

pandas根据另一个df的列上的一个条件为df创建一个布尔列

我有两个dfs,A和B. A就像,日期ID 2017-10-31 1 2017-11-01 2 2017-08-01 3 B就像,输入id 1 1 2 2 3 3我想创建一个A的新布尔列has_b,...

回答 1 投票 2

熊猫 - 以系列和延迟操作

我在Pandas中有以下数据框。我怀疑的是如何在有时间延迟的系列中进行操作。例如,我想计算一个...的GDP除以的结果...

回答 2 投票 1

pandas:在Dataframe的每一行上应用函数

我有一个包含3列的pandas DataFrame:| val1 | val2 | val3 | | -------------------------- | |耐克| NaN | NaN | |男士|阿迪达斯| NaN | |彪马|红色|女人......

回答 1 投票 0

如何在Pandas布尔减少中获得列名结果为True

我有一个df,0 1 2 A -0.740485792 -0.299824912 0.169113705 1 1.120120949 -0.62580736 0.013757667 2 -0.685112999 0.439492717 -0 ....

回答 1 投票 2

在线阅读csv,错误标记数据

.csv格式的数据文件可以在本地计算机中成功读取。 df = pd.read_csv(“./ data.csv”)文件在这里上传。但是,我使用两种方法上传数据...

回答 1 投票 1

如何从pandas DataSeries中提取唯一的排列?

使用Pandas DataSeries在Jupyter中工作我有一个像这样的行的数据集:color:white engineType:diesel make:Ford manufacturingYear:2004 accidentCount:123我需要做的是绘制......

回答 1 投票 5

如何使用正则表达式,计数器或字符串方法遍历pandas数据帧并返回字典?

我有一个熊猫数据框,在不同的行上列出了常见的婴儿名字。我需要循环遍历每一行中的每个名称,并检索字母表中每个字母显示为最后一个...

回答 1 投票 1

Pandas Pivot表手动排序列[重复]

对于给定的数据框:UUT testa testb testc testd DateTime 2017-11-21 18:47:29 1.0 1.0 1.0 3.0 2017-11-21 18:47:30 1.0 2.0 1 ....

回答 1 投票 7

如何检查列中的所有值是否满足数据框中的条件?

如何检查col1下的所有值是否满足> 2的条件?导入pandas为pd d = [{'col1':3,'col2':'wasteful'},{'col1':0,'col2':'几乎'},] df = pd ....

回答 2 投票 2

如何打印Recle和Accuracy以及Sklearn中GridSearch中使用的参数?

我想打印精度,回想一下Grid中使用的每个参数,如何做到这一点。来自sklearn.grid_search的我的Gridsearch代码导入GridSearchCV rf1 = RandomForestClassifier(n_jobs = -...

回答 1 投票 3

如何在python中使用多处理将df的内容写入csv文件

我有一个函数将df的内容写入csv文件。 def writeToCSV(outDf,defFile,toFile,retainFlag = True,delim ='\ t',quotechar ='“'):headers = [] fid = open(defFile,'r')...

回答 2 投票 0

用熊猫生成矩阵

我想使用pandas为数据df生成一个矩阵,其逻辑如下:Group by id Low:Mid Top:End For Day 1:Count if(如果level有Mid和End,如果day == 1)对于第2天:算一下......

回答 1 投票 0

将pandas数据框中的值替换为其他条件

我有一个数据帧ID main_value 1 10 2 3 4 1 6 10我想改变id = 4的main_value,这样它应该递减2.我知道一个方法使用.loc freq = 3如果freq == 3:.. 。

回答 1 投票 1

pandas在列上使用cumsum但重置计数

这篇文章和这篇文章让我很接近,但我无法解决我的问题。我有一个看起来像的df:2017-04-03 2017-04-04 2017-04-05 2017-04-06 id ...

回答 2 投票 2

© www.soinside.com 2019 - 2024. All rights reserved.