dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

合并包含极值的数据帧

我有2个数据帧,df1和df2:df1输出[66]:AB 0 1 11 1 1 2 2 1 32 3 1 42 4 1 54 5 1 66 6 2 16 7 2 23 8 3 13 9 3 24 10 3 35 11 3 46 12 3 51 13 4 12 ...

回答 2 投票 -2

更改现有数据框架的架构

我想更改现有数据帧的模式,同时更改模式我遇到错误。我可以更改数据帧的现有模式。 val customSchema = StructType(Array(...

回答 2 投票 0

连接具有特定宽度整数的列

我有一个带有两个整数列的数据框'df':C1 C2 8 49 .. ..从这里,我想创建一个新列,它连接两个具有特定宽度的列。 C1应该是两位数的宽......

回答 3 投票 3

在pandas中创建列的编码列

我的pandas数据框中的列具有以下值之一[优秀,良好,平均,差,非常糟糕]。我想在同一个数据框架中创建一个列,每个列都包含[优秀,良好,平均,差...

回答 1 投票 -2

字符串操作到Dataframe

我从信用卡对帐单中提取了文本,仅对整个月内的交易进行了切片,并将其保存在列表中。这个列表长404个字符串,摘录了......

回答 1 投票 0

LableEncoder()错误(sklearn)

如何在python 3.0(Anaconda)中处理LableEncoder()?当我运行我的数据时出现错误,如'

回答 2 投票 -1

修改DataFrame索引

我有一个错误的DateTimeIndex DataFrame。小时和分钟必须向左移动:2016-07-07 00:08:30 - > 2016-07-07 08:30:00我知道如何使用正则表达式进行更改,但我不知道.. 。

回答 1 投票 0

在Pandas中使用.map从字典创建列时,省略大括号

我不确定我的标题是否足够清晰,但我有以下问题:我想使用.map从我的数据框中的字典创建一个新列。这是按预期工作,除了一个......

回答 3 投票 1

将Pandas数据框列值合并到新列中

我正在和Pandas一起工作,我有一个数据框,我们可以在其中填充三个值中的一个:ID_1 ID_2 ID_3 abc NaN NaN NaN def NaN NaN NaN ghi NaN NaN jkl ...

回答 3 投票 12

在三个DataFrame中查找复合键的存在,并相应地连接DataFrame

这个问题很难说。以下是一个可重复示例的示例代码:将numpy导入为np导入pandas为pd df1 = pd.DataFrame([['a',1,10,1],['a' ,2,20,1],['b',1,...

回答 1 投票 1

Dataframe Spark 2.2.1上的可调用列对象

在Spark版本2.2.1中相当于此调用的是什么:df.column_name.eqNullSafe(df2.column_2)(df.column_name不可调用。它在2.3.0中工作但在2.2.1中我得到错误:TypeError :'...

回答 1 投票 1

加入来自不同季节/年的两个数据集,与体育有关(例如,NHL,1991和1992年季节)

在一定年限内,我有NHL团队的数据集。我想知道加入这些数据集的最佳方法。例如,我有芝加哥黑鹰队的统计数据,从1991年和1992年开始,玩游戏(...

回答 1 投票 0

如何建立自动划分列值?

我有一些具有不同ncol的数据帧。我想用来自第二列的特定规则替换该值,此列中的值应该是原始值除以...

回答 1 投票 2

仅对pandas dataframe中的某些列名进行字符串操作

我在数据帧ID c1 c2 c3 c4 c5 c6 c7 c8 c9 c10 c11 c12 ... cN中有列名,但我希望它看起来像ID c01 c02 c03 c04 c05 c06 c07 c08 c09 c10 c11 c12 ... cN怎么能我只改变......

回答 1 投票 0

匹配R中的值[重复]

说,我有数据集mydat =结构(列表(x1 =结构(c(2L,3L,4L,5L,1L),. Label = c(“”,“a”,“b”,“c”,“d) “),class =”factor“),x2 =结构(1:5,.Label = c(”a“,”b“,”c“,”d“,”e“),class = ...

回答 1 投票 0

连接数据框中的列

我有一个大的csv文件,我已经过滤掉了我想要的行,并创建了更小的更易于管理的数据帧(称为“CL”)。 Int64中的每一行都有合约月和合约年(我...

回答 1 投票 2

计算xarray数据集中两个变量的外积

我想在xarray.Dataset中沿共享维度计算两个变量的外积。具体来说:假设我有一个以下形式的xarray数据集:import numpy as np ...

回答 1 投票 0

使用月份差价重新格式化数据框,并按R中的日历顺序排序[重复]

我有一个data.frame给出如下。我试图将它从长格式转移到宽格式。使用传播列为日期。使用来自tidyr包的传播功能提出了两个问题:...

回答 3 投票 5

pandas multiindex将标签添加到索引级别

我有一个带有multiindex的pandas数据帧如下:TALLY DAY NODE CLASS 2018-02-04 pdk2r08o005 3 7.0 2018-02-05 pdk2r08o005 ...

回答 1 投票 0

按列名称变量选择数据框列

假设我有一个如下所示的数据框:dframe = data.frame(x = c(1,2,3),y = c(4,5,6))并且假设我想自适应地抓住另一个列,这样,对于dframe的每一行,我......

回答 2 投票 3

© www.soinside.com 2019 - 2024. All rights reserved.