dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

使用纵向数据创建起始值变量(有条件)

我正在尝试创建一个新变量,它基本上是我的数据帧中另一个变量的起始值。示例数据:id

回答 2 投票 2

Python - 将列值分组到类中

我有一个包含以下数据的CSV:客户年龄A 10 B 53 C 20 D 2 E 55 F 12为此,我使用Pandas库来读取csv。我......

回答 2 投票 2

从其他数据框的查找替换数据框中的列

嗨,我有两个数据框,一个包含: - 国家代码|人口 and another containing:- 国家代码|国家的名字。 I want to do a replace in the ...

回答 2 投票 1

Pandas DataFrame.Apply输出格式

有关python pandas.DataFrame中的apply()方法输出的问题Q1 - 为什么这个函数返回一个pandas.DataFrame,其格式与输入(pandas.DataFrame)相同...

回答 2 投票 2

如果两者中的前两列匹配,则将数据帧的一列中的值添加到另一个数据帧的新列中

我有一个35K点和2列的数据框(d1)。我有第二个数据框(d2),352个点,3列。我一直试图做的是如果d1 $ c1和d1 $ c2等于d2 $ c1和d2 $ c2,...

回答 2 投票 0

如何在R中将数据从月度转换为年度? [重复]

我需要将每月观察结果转换为年度国家而不是月国。这是数据的外观:年月国家代码队伍1990年1美国6 1990年2 ...

回答 1 投票 -2

根据条件识别特定行之后的行

我有一个dataframe / tibble,包含几个国家的年度观察。在特定事件发生的年份中,变量事件获得值1.我现在正在尝试指定新列...

回答 1 投票 1

复制具有缺失值的行并使用向量替换缺失值

我有一个数据框,其中一列有一些缺失值。我想复制缺少值N次的行,其中N是包含替换的向量的长度...

回答 2 投票 1

Pandas使用列标题作为值将多个列转换/合并为单个列

我希望将三列组合成一个数据框中的单个列,使用列标题作为新列的值。所有三列的唯一值都为'1',其他两列...

回答 1 投票 1

我如何将帧数据更改为时间序列?

我每天的降雨量数据为36年。我想分析时间序列,但我的数据仍然是帧数据的形式,我如何将帧数据更改为时间序列。我的数据是变量,如何......

回答 1 投票 -2

Python Pandas - 迭代唯一的列

我试图迭代一个独特的列值列表,以创建三个不同的键与字典中的字典。这是我现在的代码:将pandas导入为pd dataDict = {} ...

回答 1 投票 0

pyspark使用数据帧运行线性回归

我尝试在pyspark中使用数据框运行线性回归,但是在我尝试使用函数来创建字段,标签之后,它仍然给我一个错误。有人可以帮我弄清楚如何运行线性...

回答 1 投票 0

分组数据帧然后在pandas中过滤的最有效方法

下午全部,我有一个非常大的数据集,我已经分组。下面是一个示例:df_ccy = df.groupby(['currency_str','state'['state']。count()。reset_index(name ='count')。sort_values(['count'],...

回答 1 投票 1

dataframe我可以正确提取列表中的纯值吗?

我目前是一名Python自学成才的初学者。对于索引,行在df_price.iterrows()中:prod_weight = prod_weight = prod_data.loc [prod_data ['sku'] == row ['sku']] ['weight'] ....

回答 1 投票 -1

将命名列添加到R中的数据框[重复]

我正在重新格式化一些数据框,并想知道是否有更有效的方法将命名列添加到数据框,而不是下面的:colnames(df)

回答 3 投票 1

在Python“html5lib not found”中将html读取到数据框时出错

在尝试读取html数据框时,我遇到了关于html5lib的以下错误。这是代码:!pip install html5lib!pip install lxml!pip install beautifulSoup4 import html5lib ...

回答 1 投票 1

Scala / Spark数据帧数组

[我们正在测试一种在优化时可提供出色并行性的驱动程序。诀窍是,它没有在Spark分区内并行化(在访问DB2中),所以要求是我们告诉它......

回答 1 投票 1

如果在间隔中,则数据帧中的值为零

我仍然是R的新手,我试图将数据帧中的值设置为零,如果它们在区间IR e {-0,5:0,5}中,则数据框如下所示:var1 var2 var3 1 -0.2 1.0 0.7 2 0.2 -0.5 ......

回答 2 投票 1

PySpark数据框显示错误的值

我刚刚从Pandas切换到PySpark数据框,发现在PySpark数据框中打印出相同的列会产生错误的值。这是一个例子:使用熊猫:df_pandas = pd.read_csv(“犯罪......

回答 1 投票 0

Python 3.4 - Pandas - 帮助正确排列数据帧列和删除无效列

这个问题基于Python - Pandas - 根据我之前提到过的分类值,将多列的行组合成数据帧中的单行。我在下面有一张桌子......

回答 1 投票 2

© www.soinside.com 2019 - 2024. All rights reserved.