dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

pandas:从一个 csv 读取多个数据帧

我有一个 csv 文件,如下所示: A 栏、B 栏 1, 5 2,7 78,65 ########### 5,8 15,23 ########### 17, 15 25,62 12,15 95,56 如何将其转换为一组数据帧,一个数据帧对应于...之间的每个区域

回答 1 投票 0

pandas.read_csv 忽略字符串的引用

我在将 csv 文件读取/导入到 pandas 数据框中时遇到一些问题。导入不会跳过引号中的逗号。 我尝试过不同的 quotechar 选项,但没有......

回答 1 投票 0

需要在 PySpark 或数据场上运行递归 SQL 查询以实现以下场景

这是开发中的一个例子: 设备 1 将设备 3 作为父设备。 设备 3 将设备 53 作为父设备。 设备 53 没有父设备。 在黄金资产表中,您将看到以下 3 条记录...

回答 1 投票 0

使用参数化名称创建数据框

我有一个像这样的数据框: df 名称值 0 至 10 1个5 2b 4 3b 8 我想使用“名称”功能创建过滤数据集。就像是: 对于 ['a', 'b'] 中的 i: df_{i}...

回答 1 投票 0

如何读取多个 CSV 文件并将它们放入单独的 Pandas 数据框中?

我正在尝试循环遍历包含多个 CSV 文件的目录并将它们读入(单独的)pandas 数据帧。 我尝试了多种方法,但我无法做到这一点。不过我还是设法阅读了...

回答 4 投票 0

Python 数据框:动态数据框和列名称

我有以下源数据框: 数据 = { “类别”:[“A”,“A”,“B”,“C”,“C”], “值”:[16,10,8,8.3,17] } df = pd。

回答 1 投票 0

如何转储数据框中多列的标签编码器值

如你所见,我这里有一个预处理函数并做了一些转换操作。我有一些分类变量,我将它们定义为 categorical_cols,并为它们使用 LabelEncoder....

回答 1 投票 0

Pandas 问题:“DataFrame”对象没有属性“get_group”

我试图从 pandas 中的分组数据框中获取不同的组,但出现错误。 这是代码: 将 pandas 导入为 pd 表 = pd.read_csv("April24_HD_T2_MMStack_Default_edges...

回答 1 投票 0

我的 Pandas 错误地从 .xlsx 文件读取值

我正在尝试将 .xlsx 文件读入数据帧。 在 Excel 中打开的 .xlsx 如下所示: 标题 1 标题 2 标题 3 苏打 12 4 流行音乐 12 2 可乐 12 3 但是我使用的数据框: df = pd。

回答 2 投票 0

Pandas:将单个索引数据帧中的行转换为多级索引数据帧中的列

我有以下数据框: 月份名称 产品类别 公制 Flipkart Active 4 月 0 日 配件库存数量 NaN 1808.00 4 月 1 日

回答 1 投票 0

pandas 替换命令无法将分类数据更改为数值数据

我正在研究一个玩具数据集(3 列 x 9 行)。每列都有分类值;我想用数值替换它们。我正在使用熊猫。 代码: 实例数据 Q1 ...

回答 1 投票 0

在python中合并多个财务报表,仅通过定位

我在列表上的一个类别内有多个 df 形式的财务报表,我想合并每个类别的所有财务报表,同时保留信息,而不是重复相同的...

回答 1 投票 0

属性错误:“tuple”对象没有属性“to_csv”

我想将清理后的数据集导出到 CSV 中。我收到错误消息: AttributeError Traceback(最近一次调用最后一次) 单元格位于\[57\],第 20 行 18 # 保存干净并

回答 1 投票 0

Spark:未找到参数证据的隐含内容

我在 Scala 上有以下 Spark 代码: def main(args: Array[String]): 单位 = { val Spark = SparkSession.builder.master("local").getOrCreate() 导入spark.implicits._ ...

回答 1 投票 0

如何根据 pandas 中的日期创建新的数据框

我从 CSV 创建了一个数据框,其中的日期以 milis 为单位。我设法把它变成了一次约会,这正是我想要的。然而,当我尝试创建一个具有单独日期的新数据框时,这只母鹿......

回答 1 投票 0

将文本列拆分为具有来自另一个数据帧的特定列名称的不同列

我有两个数据框data1和data2。想要根据 data1 中的列拆分 data2[Text]。但我不明白如何开始解决这个问题;请建议用代码解决。 } 数据1 = {...

回答 1 投票 0

如何读取多个 csv 并将它们放入单独的 Pandas 数据框中?

我正在尝试循环遍历具有多个 CSV 的目录并将它们读入(单独的)pandas 数据帧。 我尝试了几种方法,但我无法做到这一点。不过我确实设法...

回答 2 投票 0

创建数据框行而不单独指定每个列值?

注意:我在这些论坛上找到的唯一关于此问题的帖子是关于 SQL INSERT 语句的,而不是关于 Python DataFrames 的。 背景: 我有一个包含很多列的数据框。到底是怎样的人...

回答 1 投票 0

根据列值的计数过滤 pandas 数据框

我有一个看起来像这样的数据框 - 将 pandas 导入为 pd Sample_df = pd.DataFrame(columns=["A", "B"], data=[[1, "红色"], [2, "蓝色"], [3, "绿色"...

回答 1 投票 0

根据 pandas 数据框中另一列的不同值将列转换为计数

我有一个来自wiki的panads数据框 展望 温度 湿度 风力 播放 晴天热高假无 阳光明媚热高真无 阴热...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.