dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

R:按列平滑df值

我有一个df,我想变成折线图。如下所示,图表有很多峰值,所以我决定我应该平滑每个变量的值。有没有办法取代每个细胞...

回答 1 投票 0

Pandas Dataframe,当列不相等时加入两个dt

假设我有两个数据表,相同的形状,比如N行和2列。它们具有相同的列名“One”,“Two”调用第一个表“left”,然后调用第二个表“right”。我该怎么回新...

回答 1 投票 1

python如何将数据传输到数据帧,如u'** \ t ** \ r ** \ t ** \ r'

我有一些这样的数据,u'1 \ t \ u80a1 \ u7968 \ r2 \ t \ u503a \ u5238 \ r3 \ tTOT- \ u6211 \ u53f8 \ u5355 \ u4e2a \ u4fe1 \ u6258 \ u8 \ u812 \ u \ t \ u408 \ u708 \ u7 u900f \ u5f0f \ uff09 \ R4 \ tTOT- \ u6211 \ u53f8 \ u591a \ u4e2a \ u4fe1 \ u6258 \ ...

回答 2 投票 0

基于行索引拆分数据框

我想通过循环遍历行和子集index =(diff(Data $ Time> 1800))来分割我的数据帧(i in 1:length(indices)){if(indices [i] == TRUE){## ###我需要一个函数来分割数据......

回答 1 投票 1

具有2个标准的Python Dataframe Vlookup

我有一个具有多个日期/时间/价格的数据框,但是喜欢在每天1600提取价格以创建一个新列(Priceat1600)。 (因此它需要Vlookup在1600年的日期和时间)...

回答 2 投票 1

合并具有不同级别的两个Dataframe并将一级分层行索引移动到列

我有两个我要合并的数据帧:第一个:在:数组= [['RMP1','RMP1','RMP1','Coop','Coop','Coop','RMP2','RMP2' ,'RMP2'],['1。瓦拉日丁, '5.Vipap','11。布尔诺”, '1.Varazdin',...

回答 1 投票 1

计算R中多列中的字符值

我有一个数据框,就像这样:团队成员

回答 2 投票 1

python - 来自2个groupby列的聚合计数的最大值

我想从列名称和小时数的行数中获取最大值:导入pandas为pd小时= [8,8,9,9,8,9,10,10,8,9,12,12,10 ,11,12,12]姓名= ['A','B','......

回答 3 投票 0

转换CassandraTableScanRDD org.apache.spark.rdd.RDD

我有以下情况。我有大型Cassandra表(有大量列),我想用Spark处理。我只想将选定的列加载到Spark中(应用选择...

回答 1 投票 1

想要用Python替换某些值的列

使用的代码:def fn(x):for x in x:x = x.replace('Wood','Wooden')return x test ['Coming:'] = test ['Column:']。apply(fn)样本输出:列:即将来临:需要:木...

回答 2 投票 0

每天计算实例pandas数据帧

我有一个数据帧df = pd.DataFrame(data = [[1,0],[1,0],[2,0],[2,1]],columns = ['day','class'])我想每天计算一级的实例。我用这种方式使用groupby,df.groupby(['...

回答 3 投票 0

将列添加到Multiindex Dataframe

我想在下面的df1中添加一个列SUM。它是一个Datetime MultiIndex,新列SUM应该返回价格行的总和。 multex = pd.MultiIndex.from_product([['price','weight','...

回答 1 投票 1

Python Pandas Fillna Median无效

我试图填充包含多列和多行的数据框中的所有nans。我正在使用它来训练多变量ML模型,所以我想用...填充每列的nans ...

回答 1 投票 3

pyspark内存消耗非常低

我正在使用anaconda python并在其上安装了pyspark。在pyspark程序中,我使用数据帧作为数据结构。该程序如下:从pyspark.sql导入SparkSession ...

回答 1 投票 0

Python Pandas Dataframe基于A列拉取B列的单元格值

在这里挣扎。可能会遗漏一些非常容易的东西,但是在试图学习Python并且意识到这可能不会为我解决这个问题时,我的头在我的桌子上。我有一个 ...

回答 2 投票 0

如何在Pandas中迭代MultiIndex级别?

我经常有MultiIndex索引,我想迭代更高级别索引相等的组。它基本上看起来像随机导入选择导入熊猫pd N = 100 df = pd ....

回答 2 投票 5

read.csv错误列比列名更多?

我尝试使用来自https://data.worldbank.org/indicator/IS.AIR.PSGR的read.csv导入csv格式的数据但是,read.csv函数返回:read.table中的错误(file = file, header = ...

回答 1 投票 0

将数据帧写入不同的Excel表格

我正在抓取网上的一些数据并将其写入大约6个数据帧。然后,我想将每个数据帧写入Excel文件中的单独工作表。我在网上看过并试过两个......

回答 1 投票 0

Pandas数据帧设置单元格为NaN

我创建了一个这样的数据帧:AB 0 aa 1 1 bb 2 2 cc 3 3 dd 1 4 ee 1然后我用这一行插入一个标签:df ['label'] = np.where((df ['B ']> 2),'start',np.NaN)结果是......

回答 2 投票 1

在数据帧列表中进行变换

我有以下数据框列表。我的列表

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.