dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

如何在连接两个数据集时获取最新行,并且最新行应小于数据集“A”中的日期[重复]

考虑我有一个数据集,其中有一个每天生成的日期列,如下所示。 DF_A ID 名称 数量 日期 1 abc 20 17/01/2022 1 abc 10 18/01/2022 2 定义...

回答 1 投票 0

如何对 pandas 中的重复数据进行分组求和——同时仍保留其他列

我是熊猫新手,正在努力解决一些数据争论问题。 我有一个数据源,大约如下所示: 可用位置 出售名称 local_id more_data 0 100...

回答 1 投票 0

如果值不存在,则通过对列进行分组来追加新行[重复]

我想通过对年份和月份进行分组,每个年份和月份都有不同的帐户,如果该帐户在该年和月份不存在,则该值将为0。 我该如何解决这个问题?

回答 1 投票 0

如何固定时间序列数据中的第一个值

我的问题很简单,因为我是初学者。我有以下问题。 我有 2 天的股票价格数据,有 7 个时间点,即 14 行。 DataFrame 列是 DATE、Time_IDX 和 P...

回答 1 投票 0

如何与 QVector 配合使用<QVector<float_t>>。优化的方式是什么? [已关闭]

我正在使用 Qt C++,尝试使用 QVector 来存储 4 个交错通道文件中的数据,并在后文中使用它。 我尝试过类似的方法,但仍然不确定如何存储每个chan...

回答 1 投票 0

R:创建包含字符串最大值的新数据框列的更有效方法

示例 DF: 国家 <- c('Australia', 'Italy', 'Peru', 'China') score <- c("0.091", "0.413,.", "-", "0.102,0.102,0.102,.,.,.,.,.,.,.,.") country_scores...

回答 1 投票 0

使用一条语句将多行更新从 pandas DataFrame 应用于 SQL Server 表

我正在尝试使用 pandas 数据帧中的值更新 Microsoft SQL Server 表条目(使用 pypyodbc)。目前,我正在从 pandas 数据帧创建一个 numpy 数组,然后迭代 ea...

回答 1 投票 0

使用一条语句将多行更新从 pandas DataFrame 应用于 SQL Server 表

我正在尝试使用 pandas 数据帧中的值更新 Microsoft SQL Server 表条目(使用 pypyodbc)。目前,我正在从 pandas 数据帧创建一个 numpy 数组,然后迭代 ea...

回答 1 投票 0

如何检查pandas数据框中的<NA>类型变量是否是<NA>? np.nan() 不工作

我有一个数据框,其中有一列,其值类似于: YEAR_多伦多 0 1 2016 2 3 1999 我需要单独检查该数据框的每个元素...

回答 2 投票 0

如何根据包含相同值的特定列获取总和

数据帧具有 code1、code2、code3 等列,其中存储有代码。对于每个代码,有一列包含使用天数 days_used1、days_used2、days_used3 等。我想获取 datafr...

回答 1 投票 0

如何将水平数据变为垂直?

在这里,我使用 Selenium 抓取了 2021/22 至 2024 赛季的英超联赛积分榜,并将其存储在 table_data 中,如下所示: [['1', '兵工厂', '33 23 5 5 77 26 51 74', 'D', ...

回答 1 投票 0

如何编辑我的代码,以便梯度函数的应用列中只有一个数字?

所以我有一个包含 NaN 值的数据框,我将它们替换为 0(您将在下面看到)。 我尝试计算每行的 np.gradient 。我将输出应用到新列,但该列有多个

回答 1 投票 0

从网络抓取数据

目前我有一个从特定网站爬取数据的项目,如下所示,这是我自 2023 年以来用于爬取的代码,现在在 2024 年网站已更改,我不知道如何修复

回答 1 投票 0

如果行和列名称以相同前缀开头,则将矩阵值设置为 0

假设您有以下数据框: df <- data.frame(industry = c("DEU_10T12", "DEU_13T15", "DEU_16", "DEU_17", "ITA_10T12", "ITA_13T15&

回答 3 投票 0

矩阵中的循环效率问题

假设您有以下数据框: df <- data.frame(industry = c("DEU_10T12", "DEU_13T15", "DEU_16", "DEU_17", "ITA_10T12", "ITA_13T15&

回答 1 投票 0

如何使用另一列的平均值填充数据框列的缺失行?

我有一个带有一些缺失值的数据框,我想填充缺失值而不是删除它们。 但编写函数后,我收到错误: ['MSSubCLass'] 不在索引中。 LotFront...

回答 3 投票 0

Pandas `merge_asof` 但填充了 nan 值而不是重复值

我目前有这个快速示例可以使用: 将 pandas 导入为 pd left = pd.DataFrame({"left_val": [1, 2, 3, 6, 7]}, index=pd.to_datetime([1, 2, 3, 6, 7], 单位='s')) 右 = pd.DataF...

回答 1 投票 0

在“when-then-otherwise”表达式中展开多列

我想用以下逻辑编写一个极坐标的“当-则-否则”表达式: 如果 a1 和 a2 不为空且 b1 和 b2 为空 那么 b1=a1, b2=a2 否则保留 b1 和 b2 的值 举个例子,我...

回答 1 投票 0

基于另一列的索引更改

考虑 df 的这一列: 人实体ID 0 324141 1 2 425544 3 4 434456 我可以重新索引它,以便当列中有新值时它会发生变化: 人实体ID 0 324141 0 ...

回答 2 投票 0

Pandas 基于多列进行分组和转换

我见过很多类似的问题,但似乎没有一个适合我的情况。我很确定这只是一个 groupby 转换,但我不断收到 KeyError 和轴问题。我正在尝试分组

回答 3 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.