dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

如何解构极坐标中的嵌套结构(python api)?

不幸的是,我不得不处理极坐标数据框中的一些嵌套数据。 (我知道这是不好的做法)考虑数据: 数据 = { “职位”:[ { “公司&q...

回答 1 投票 0

读取Excel文件中非表格的表格

我目前正在尝试读取包含多个表格的Excel文件,但表格没有保存为表格,它们就像信息一样保存,但分为表格(不知道这是否有意义)...

回答 2 投票 0

遍历两个 pandas dfs 并在 python 中的外部函数中使用数据的最佳方法

我有两个 pandas dfs,一个包含工作人员列表,另一个包含任务列表。我打算把任务分配给工人。每个任务都需要一定数量的工人和我的方式

回答 1 投票 0

初始化具有 1500 万条记录的极地数据帧会导致机器冻结

我正在使用 Psycopg3 连接器从 AWS RDS Posgres 数据库获取记录,并使用以下代码初始化 Polars 数据帧: rds_conn = psycopg.connect( 主机=config.RDS_HOST_NAME...

回答 1 投票 0

极坐标数据框中每组的样本?

我正在寻找类似的功能 df.groupby('列').agg(样本(10)) 这样我就可以从每组中随机选择十个左右的元素。 这是专门为了让我可以阅读

回答 3 投票 0

即使 df 所基于的表被删除,spark 如何显示数据帧的输出?

考虑 Azure Databricks 上的以下场景。 Spark.table("table1").createOrReplaceTempView("test_view") df = test_view.drop("col1") Spark.sql("删除表

回答 1 投票 0

用于删除复杂 Json 模式中的列的 Pyspark 代码

团队, 我是 Pyspark 编程的初学者 我正在尝试从下面架构中存在的数组列中删除“ProductEntityCode”。此列嵌套在

回答 1 投票 0

我可以使用 for 循环选择数据框中的列吗?

我有一个包含超过 400 列的数据框,我试图根据某些条件选择一个包含大约一半列的子 df。我已经将过滤后的列存储为列表,希望......

回答 1 投票 0

如何使用数组的最小条目来分割数组

我试图通过在第一列中找到其最小点来将数据集分成两个单独的数据集。我使用 idxmin 首先确定最小条目的位置,然后使用 iloc 来...

回答 1 投票 0

如何找到最后一列的值(每行),其中一些行的值全部为 NA?

我遇到了与如何在 R 中查找最后一列有值(每行)相同的问题?,除了我有没有值的行(整行 NA)。该帖子中提供的样本没有完整的...

回答 4 投票 0

对分组的 pandas 数据框中的行求和并返回 NaN

示例 将 pandas 导入为 pd 将 numpy 导入为 np d = {'l': ['左', '右', '左', '右', '左', '右'], 'r': ['右', '左', '右', '左', '右', '左'], 'v': [-1, 1, -1, ...

回答 5 投票 0

如何分解多个列表,每个列表具有随机长度且列具有随机键名称?

我通过使用网站的请求 API 随机生成了一个带有随机标头的 Dataframe。我正在尝试同时分解具有随机长度和随机键名称的多个列表,所以......

回答 1 投票 0

如何使用基于其他值相似的列的列表中的中值来填充空 NaN 数据

需要用其他区域的中值(等于或小于“总计”值)替换空的 Nan 值(“区域”列)。 例如: 第 2 行的值为“total”==8。 S...

回答 1 投票 0

根据另一个数据帧中的值替换部分数据帧值

我的 Databricks 笔记本中有两个数据框。例如,数据如下所示: df1: 身份证号码 1 200/300A/200B 2 805/805B/500 3 22A+100B 4 200/300A/200B+22A+100B; 5 100+-805/+22A+100B; 6 ;...

回答 2 投票 0

使用 pandas 将 df 中的行移动单元格的值

我有以下输入表,我想获取输出表。 为此,我必须检查从第 14 行到文件末尾的每个单元格内容的最后部分,如果我...

回答 1 投票 0

如何使用Python合并大型CSV文件?

我有一个包含许多大型 CSV 文件的数据集(总体积为 30GB)。每个文件都提供有关人员的特定类型信息。但所有文件都有一个名为“ID”的列,它描述了谁是......

回答 2 投票 0

对数据帧(包括掩码的第一个实例)进行切片的最佳方法是什么?

这是我的数据框: 将 pandas 导入为 pd 将 numpy 导入为 np df = pd.DataFrame( { 'a': [np.nan, np.nan, np.nan, 20, 12, 42, 33, 32, 31], 'b': [np.nan, np.nan, np.nan, np.nan, 23...

回答 1 投票 0

根据第一列中的值将函数应用于数据框中除第一列之外的所有行和列

您好,希望我能简单地解释一下。我知道这可以通过循环来完成,但这将花费很长时间,并且我需要将这种分析作为网页的一部分来完成,所以某种 ap...

回答 2 投票 0

将复杂的组合列表转换为数据框

我创建了以下代码,生成组合列表 图书馆(联合) 数据(冰) 实验<-expand.grid( flavor=c("chocolate","vanilla","strawbe...

回答 1 投票 0

从生成器到 Pandas DataFrame - 如何做到这一点?

嗨,可爱的聪明人社区! 我正在尝试将 Redshift 表中的一些数据加载到 pandas DataFrame 中。我必须承认,我在大学时代并没有太多使用过 Pandas,而且更像是一个麻木的亲戚......

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.