dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

合并具有不同级别的两个Dataframe并将一级分层行索引移动到列

我有两个我要合并的数据帧:第一个:在:数组= [['RMP1','RMP1','RMP1','Coop','Coop','Coop','RMP2','RMP2' ,'RMP2'],['1。瓦拉日丁, '5.Vipap','11。布尔诺”, '1.Varazdin',...

回答 1 投票 1

计算R中多列中的字符值

我有一个数据框,就像这样:团队成员

回答 2 投票 1

python - 来自2个groupby列的聚合计数的最大值

我想从列名称和小时数的行数中获取最大值:导入pandas为pd小时= [8,8,9,9,8,9,10,10,8,9,12,12,10 ,11,12,12]姓名= ['A','B','......

回答 3 投票 0

转换CassandraTableScanRDD org.apache.spark.rdd.RDD

我有以下情况。我有大型Cassandra表(有大量列),我想用Spark处理。我只想将选定的列加载到Spark中(应用选择...

回答 1 投票 1

想要用Python替换某些值的列

使用的代码:def fn(x):for x in x:x = x.replace('Wood','Wooden')return x test ['Coming:'] = test ['Column:']。apply(fn)样本输出:列:即将来临:需要:木...

回答 2 投票 0

每天计算实例pandas数据帧

我有一个数据帧df = pd.DataFrame(data = [[1,0],[1,0],[2,0],[2,1]],columns = ['day','class'])我想每天计算一级的实例。我用这种方式使用groupby,df.groupby(['...

回答 3 投票 0

将列添加到Multiindex Dataframe

我想在下面的df1中添加一个列SUM。它是一个Datetime MultiIndex,新列SUM应该返回价格行的总和。 multex = pd.MultiIndex.from_product([['price','weight','...

回答 1 投票 1

Python Pandas Fillna Median无效

我试图填充包含多列和多行的数据框中的所有nans。我正在使用它来训练多变量ML模型,所以我想用...填充每列的nans ...

回答 1 投票 3

pyspark内存消耗非常低

我正在使用anaconda python并在其上安装了pyspark。在pyspark程序中,我使用数据帧作为数据结构。该程序如下:从pyspark.sql导入SparkSession ...

回答 1 投票 0

Python Pandas Dataframe基于A列拉取B列的单元格值

在这里挣扎。可能会遗漏一些非常容易的东西,但是在试图学习Python并且意识到这可能不会为我解决这个问题时,我的头在我的桌子上。我有一个 ...

回答 2 投票 0

如何在Pandas中迭代MultiIndex级别?

我经常有MultiIndex索引,我想迭代更高级别索引相等的组。它基本上看起来像随机导入选择导入熊猫pd N = 100 df = pd ....

回答 2 投票 5

read.csv错误列比列名更多?

我尝试使用来自https://data.worldbank.org/indicator/IS.AIR.PSGR的read.csv导入csv格式的数据但是,read.csv函数返回:read.table中的错误(file = file, header = ...

回答 1 投票 0

将数据帧写入不同的Excel表格

我正在抓取网上的一些数据并将其写入大约6个数据帧。然后,我想将每个数据帧写入Excel文件中的单独工作表。我在网上看过并试过两个......

回答 1 投票 0

Pandas数据帧设置单元格为NaN

我创建了一个这样的数据帧:AB 0 aa 1 1 bb 2 2 cc 3 3 dd 1 4 ee 1然后我用这一行插入一个标签:df ['label'] = np.where((df ['B ']> 2),'start',np.NaN)结果是......

回答 2 投票 1

在数据帧列表中进行变换

我有以下数据框列表。我的列表

回答 1 投票 1

应用函数创建多列作为参数的字符串

我有一个这样的数据框:名称。大小。类型。 av_size_type 0约翰。 23。 Qapra'。 22 1丹。 21。 nuk'neH。 12 2莫妮卡。 12。 kahless。 ...

回答 3 投票 2

Pandas:根据现有列向DataFrame添加列

我有2个pandas DataFrames,我在Python中操作,我想基于某个列(col_1)组合它们:#df1 col_1 col_2 0 3 7 1 ...

回答 4 投票 4

通过在spark中使用scala加载csv文件来创建数据帧

但csv文件添加了额外的双引号,导致所有列成为单列,有四列,标题和2行“”“SlNo”“,”“名称”“,”“年龄”“,”“联系人”“” “1”, “普里亚””,78 “” ...

回答 1 投票 0

pct_change和log返回值与实际值不同

我正在研究一个有价格的数据框架。我发现返回计算的算术或日志与第一个价格值和最后一个值之间的实际回报不同。我认为它们应该是相同的......或者......

回答 1 投票 3

如何在Python中循环创建pandas中的多个数据帧?

导入pandas为pd FB = financialReturns [financialReturns ['ticker'] =='FB'] AAPL = financialReturns [financialReturns ['ticker'] =='AAPL'] NFLX = financialReturns [financialReturns ['ticker'] =='。 ..

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.