dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

如何对 DataFrame 中的值进行排序

我有一些疑问。我得到一些结果 poz = 正数[正数["数字"]>0].head(10) 波兹 我得到了输出: 数字 异常16 废除5 可恶5 可憎4 中止 1 中止...

回答 1 投票 0

如何根据多个条件解析创建标志?

我有一个包含 2 列(ID 和年份)的数据框。我想创建一个名为“FLAG”的第三列,它的输出基于以下条件(全部按 ID 分组): 如果数据存在...

回答 3 投票 0

按组选择前 n 个值,其中 n 取决于数据框中的其他值

我对 R 和编码总体来说还很陌生。我们将非常感谢您的帮助:) 我正在尝试按组选择前 n 个值,其中 n 取决于其他值(在下面称为因子)...

回答 2 投票 0

如何根据列的上升条纹创建组?

这是我的数据框: 将 pandas 导入为 pd df = pd.DataFrame( { 'a': [10, 14, 20, 10, 12, 5, 3] } ) 这是预期的输出。我想创建三个组: A 0 10 1 14...

回答 1 投票 0

加入 2 个 pyspark 数据帧并继续运行窗口总和和最大值

我有两个 Spark 数据框 数据框_1: +----------------------------+------+---------+--- --+ |时间戳|目标|counter_1|max_1| +----------------------------+------+---------+-.. .

回答 1 投票 0

按第一行中的值对数据框列重新排序

我在 R 中有一个数据框。我想根据第一行中的值对列重新排序。数据框中的所有条目都包含数字数据。我认为这会是直接且类似的......

回答 1 投票 0

Python bug 导入数据框的 csv 文件

将 pandas 导入为 pd # 读取指定编码的CSV文件 df = pd.read_csv("Moodle/perguntas_1.csv", 编码 = 'utf-8') # 显示数据框 打印(df) 它不导入...

回答 1 投票 0

计算data.frame中的行总和和乘积

我想将一列附加到 R 中的 data.frame 中,其中包含行总和和乘积 考虑以下数据框 坐标 1 2 3 2 3 4 5 1 2 我想要得到以下...

回答 5 投票 0

我想用这样的方式总结R中的一个巨大的数据框,我只需要唯一的“lat”,“lon”,“Date(Year)”和“Maxium Value”

我需要总结一个巨大的CSV文件(nrow = 1102300)。这是来自各种气候模型的每日气候数据。 首先,我想总结所有具有“历史”名称的列。我的目标是...

回答 1 投票 0

处理从 CSV 创建的数据框中的 NaN 条目

我正在尝试比较两个数据帧。第一个数据帧是从字典创建的。有些地方的值可能为空,如下所示: '房间 #': '' 第二个数据帧是根据相应的数据帧创建的...

回答 1 投票 0

来自不同数据框中的两列的新数据框

我需要从另外两个数据框的列创建一个新的数据框 df1=A, 乙, C df2 = X, 是, Z 索引是相同的,当我使用代码时会发生什么 #df3 ...

回答 1 投票 0

gym anytrading python 数据帧格式

我对gymanytrading很陌生,我有这个python数据框,其中有一列包含不同长度的列表列表,我正在尝试弄清楚如何将其放入gymanytrading

回答 1 投票 0

将 api 输出的所有响应插入具有单独列名称的 pandas 数据帧

我有一个 json 响应,如下所示。 ['{“accountNumber”:“2130005”,“billDayModelName”:“”,“billDayModelScore”:“0”,“defaultBadWriteOffModel...

回答 1 投票 0

Python,Pandas 写入数据帧,lxml.etree.SerializationError:IO_WRITE

从数据框中选取所需行的代码。原始数据是Excel格式的,我把它放在数据框中。 我想选择“测试日期”属于“201506”和“201508”的所有行,并且...

回答 2 投票 0

将 R 中特定列的值向右移动

我想将特定列的值向右移动,并将 NA 保留在左侧。 df = data.frame(a = c("一", "二", "三", "四", "五"...

回答 1 投票 0

“calculate_bartlett_sphericity”测试输出 nan 值

我有一个数据框V,如下所示: ECON1 ECON2 ECON3 食品1 食品2 食品3 ENV1 \ 28 0.310071 0.096913 0.228500 0.234986 0.260894 0.267858 0.489309 28 0.353609...

回答 1 投票 0

Pandas Dataframe 具有无法访问的列

我有一个非常奇怪的错误。 我读了一个 csv 文件,它包含 2 列:“Column”和“NA_Value”。 我正在用 pandas 读取文件。两列均可访问...

回答 1 投票 0

按日级别比较数据帧的列值与另一个数据帧

我有以下两个数据框 盒子 box_cap 尺寸偏好 1 16 1200 1 2 16 1550 2 3 15 1300 ...

回答 1 投票 0

在 PySpark 中将 Column 对象转换为 DataFrame

我有一个 JSON 列表,我正在使用 from_json 读取它。如何将生成的列类型转换为单列数据框? 从 pyspark.sql.functions 导入 from_json 来自 pyspark.sql.types 我...

回答 1 投票 0

如何从数据帧中查找属于时间范围内的行?

我想从我的数据框中找到上午 7 点到上午 11 点(含)之间的所有行 使用此代码,我将 csv 读入包含相关数据的数据框中 df = pd.read_csv(info.csv) amount_df = pd。

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.