dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

Pandas替代应用 - 基于多列创建新列

我有一个Pandas数据帧,我想根据其他列的值添加一个新列。下面是一个说明我的用例的最小例子。 df = pd.DataFrame([[4,5,19],[1,2,0],[2,5,9] ......

回答 1 投票 4

将If Then逻辑应用于数据帧R.

我想我可能会比我能咬得更多。我试图基于几个因素将逻辑方程应用于一组数据,以便为每年制定最终估计。我把所有数据都记在了......

回答 1 投票 -1

展平嵌套的pandas数据帧列

在一些聚合之后,我的数据帧看起来像这样A B B_min B_max 0 11 3 6 1 22 1 2 2 33 4 4如何使列成为A,B_min ......

回答 1 投票 1

如何将不规则数据的多级字典转换为所需的格式

Dict = {'Things':{'Car':'Lambo','Home':'NatureVilla','Gadgets':{'Laptop':{'Programs':{'Data':'Excel','Officework' :'Word','Coding':{'Python':'PyCharm','Java':'Eclipse','Others':'SublimeText'},...

回答 2 投票 0

如何在pandas数据帧的索引中使用map

我想使用索引上的值和一个将这些值转换为更有意义的字典的字典在pandas数据框上创建一个新列。我最初的想法是使用地图。我到了......

回答 2 投票 0

Python Pandas基于最小索引从数据帧中提取值

我有一个df:import pandas as pd import numpy as np df = pd.DataFrame({“price”:[1.1,66.3,11,15.2,1.1],“qty”:[14,2,1,10 ,1],“c_h”:['cheese','ham','ham','...

回答 2 投票 0

访问大熊猫数据一百万次 - 需要提高效率

我是一名试图验证实验的生物学家。在我的实验中,我在特定治疗后发现了71个突变。为了确定这些突变是否真的是由于我的治疗,我想......

回答 1 投票 3

根据每个数据帧中的因子将数据帧列表拆分为多个列表

我有一个数据框列表,其中包含(x,y)坐标的时间序列。每个数据框还有一个特定的变量 - trial_option - 我想用它来将我的数据帧列表拆分成多个...

回答 2 投票 0

使用Pandas对csv中每列中的所有列求和

我写的程序一般都做了我想要它做的事 - 大部分时间。添加每列的总计。我的数据框使用csv文件格式。我的代码如下:将pandas导入为pd ...

回答 1 投票 0

按因子类别获取数据框中的最后一个值

我有这样的数据框:a = c(“A”,“A”,“A”,“A”,“B”,“B”,“C”,“C”,“C”,“D” “,”D“)b = c(1,2,3,4,1,2,1,2,3,1,2)c = c(1345,645,75,8,95,678,598,95,75, 4,53)mydf

回答 2 投票 0

Spark将包含元组的列添加到数据帧

我正在使用Spark 1.6,我想在数据帧中添加一列。新列实际上是一个常量序列:Seq(“ - 0”,“ - 1”,“ - 2”,“ - 3”)这是我的原始数据帧:scala> df.printSchema()...

回答 2 投票 1

如何在pandas数据帧中找到行的iloc?

我有一个索引的pandas数据帧。通过搜索其索引,我发现了一排感兴趣。我如何找到这一行的iloc?示例:dates = pd.date_range('1/1/2000',periods = 8)df = pd ....

回答 4 投票 12

编写函数并将结果添加到数据框中

我正在尝试创建一个函数,它将结果的分数添加到我正在创建的数据框中,但是当我运行该函数时,它将数据框转换为值。我的代码如下:...

回答 1 投票 -1

我要求对if语句进行两次比较,但是pandas会给出错误。如何以pandas接受的方式重写语句?

if语句如下:for result in result if result <0 and test == 1:test = 0 print('patient result',(TestAmount / SMAs.amount [line] - 1))有一个序列。 ..

回答 2 投票 1

我应该如何将装满小数的数据帧转换为浮点数?

我现在面临的主要问题是DataFrame.quantile()不适用于Decimals。我可以使用df.convert_objects(convert_numeric = True)将我的Dataframe转换为浮点数,但这会生成...

回答 3 投票 3

在Pandas(Python)中按数据分组的总和

对于我的任务,我需要了解一些Python Pandas代码,以便使用另一种编程语言(Java)进行一些修改和重新实现。我参加了一些在线教程,但仍然有......

回答 2 投票 0

Python pandas计算日期之间的距离

我有两个数据帧。一旦常规数据帧:df Datum ... 2014-12-30 23:00:00 2014-12-30 23:15:00 2014-12-30 23:30:00 2014-12-30 23:45:00 2014-12-31 00:00:00 ... 2015 -...

回答 1 投票 1

在jupyter中访问数据框元素pyspark

我是spark和pyspark的新手。我的DataFrame由几列组成,而在一些列中,则是数组或子数据帧。 df的printSchema如下图所示我的问题是......

回答 1 投票 0

按特定值填充缺失值Pandas Dataframe

我有一个数据集,我想用bfill填充“value”列中的缺失数据,并为其添加一个字符串。这是我的代码:将pandas导入pd import numpy as np df = pd ....

回答 1 投票 1

尝试命名多个索引获取密钥错误

早上好,我正在使用python 3.6。我正在尝试命名我的索引(请参阅下面的代码中的最后一行),因为我打算加入另一个DataFrame。 DataFrame应该是多索引的。该指数是......

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.