dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

不明白 ValueError: 在 Python 中设置可迭代时必须具有相等的 len 键和值

我正在使用 ML 脚本,我想通过相同的方式更改列的值,但不是存储为数组的字符串。现在数据存储如下:'31-2',我想存储为'[31,...

回答 1 投票 0

`pandas`滚动总和,窗口中有效观察的最大数量

我正在寻求帮助来加快 pandas 中的滚动计算速度,这将使用预定义的最大数量的最近观察结果来计算滚动平均值。这是生成 exa 的代码...

回答 1 投票 0

从案例类的完全限定名称中获取案例类的引用,用于将数据帧转换为数据集

我有案例类的完全限定名称。对于运行时的用例,我需要获取用于将数据帧转换为数据集的案例类的引用。 例如。 我的 FQN 为:com.org.common。

回答 1 投票 0

当数据位于 pandas 中时,如何使用 Statsmodels 模块执行多元线性回归

我正在尝试使用两个数据帧中的数据进行 MLR,但其中一个数据帧的大小与另一个数据帧的大小不同,因此我发现 endog 和 exog 大小不匹配。我想知道是否有人可以帮助我理解如何...

回答 1 投票 0

查找极坐标数据框中各组之间的所有差异

我有一个极坐标数据框,我正在尝试查找一个键上的组之间的多个列上的差异(其值已更改的字段)。 datafr 中可以有多个组...

回答 1 投票 0

在数据框上使用 If/Else

我有一个数据集,看起来像 数据<-c(0,1,2,3,4,2,3,1,4,3,2,4,0,1,2,0,2,1,2,0,4) frame<-as.data.frame(data) I now want to create a new variable within this data frame. If the ...

回答 2 投票 0

在数据框的每一列中,如何找出列中每个唯一值存在的持续时间?

示例,考虑 df: 时间 colA colB 0 1.1 2 2 1 2.2 2 2 2 3.4 3 5 3 4.5 3 5 4 5.6 4 5 5 6.2 4 6 6 7.4 ...

回答 1 投票 0

Logistic回归模型产生 100% 的准确度

我已经获取了产品的亚马逊评论,现在尝试在其上训练逻辑回归模型以对客户评论进行分类。它提供 100% 的准确度。我无法理解这是...

回答 1 投票 0

Bigframes 包 - Dataframe 应用功能出现问题

我是 googleapis 的 bigframes 包的新用户。我正在尝试操作从 Bigquery 加载的数据帧。 我试图执行一些代码,但我遇到了一个我无法解决的问题...

回答 1 投票 0

如何按顺序重命名列,即(1、2、3等)

我正在使用一个已作为数据框加载的 csv 文件。它有 21,941 列,太大而无法在 Excel 中打开(这是我通常会这样做的方式)。我需要重命名所有这些

回答 1 投票 0

使用 Boto3 会话读取 S3 CSV 文件

我目前正在使用 boto3 客户端读取 Python 数据框中的 S3 csv 文件。下面是代码(无法正常工作,许多列合并为一列,而不是 40 列,我的数据框有 8 列...

回答 1 投票 0

在 R 数据框中计算访客持续时间:如何计算代理时间、房间时间和等待时间?

我有一个 R 数据框,其中包含来自机构的数据。访客 (ID) 进入代理机构 (CREATE),然后被叫到不同的房间 (CALL),并离开这些房间 (DISCHARGE)。现在,我想计算...

回答 2 投票 0

在python中分离.json文件中的数据

我试图将一些数据分离到元数据部分和实际测量中。每个文件都有多个测量值。 .json 文件如下所示。 { “版本”:“...

回答 1 投票 0

Pandas read_html 自动将任意一列转换为 str

我一直在尝试从网站上抓取表格,但由于某种原因,Pandas 会自动将每一列转换为字符串,因此某些值变得完全无用。例如,0.62 因为...

回答 1 投票 0

当 Spark 中的数据帧转换为新的数据帧时,会发生什么?

我是 Apache Spark 的初学者。我在学习 Spark 时遇到了困难。据我所知,Spark基于惰性求值工作,并且Spark中的数据帧是不可变的。 我有一个数据框 df 为 3

回答 1 投票 0

Ordereddict - 如何迭代读取 Excel 文件中所有工作表中的相同单元格?

在ordereddict的上下文中,我想循环遍历Excel文件中的所有工作表,从每个工作表中读取B2单元格的内容,然后将其打印出来。后来我打算根据...

回答 1 投票 0

计算每列的平均值并排除行

我的数据包含 1000 列和 80 行,每五行对应一个组(第一列是类列)我想计算所有数字列的每个组的平均值,然后我...

回答 1 投票 0

使用数据框作为查找表,根据另一个 df [R 代码] 的列名称创建虚拟对象

我有一个数据框“alldata”,其中的情况是组织,列中的虚拟变量名称如 Algeria_1954 - Country_year。该虚拟变量上的“1”意味着...

回答 1 投票 0

用 id 替换另一个数据帧中的 NA 值

我有一个数据框 df1 如下 - ID计数 11 345 22 456 33 786 44765 55 不适用 66888 77 不适用 然后我有一个 df2 如下 - ID计数 11 536 22654 33 786 44 999 55 890 66111 ...

回答 4 投票 0

pd.date_range 包含结束日期

使用 pandas 2.2.2 和 python 3.11,为什么这不给我包含结束日期的日期范围: 将 pandas 导入为 pd 开始日期 = pd.to_datetime('2023-04-05T04:01:40Z') end_date = pd.to_datetime('

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.