dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

使用正确值的数据帧替换数据帧中的错误值

在下面的数据中,一些名称拼写错误。我已经确定了 Unique_Names 并相应地为这些唯一名称创建了 Correct_Unique_Names。 但我想知道如何插入我的

回答 1 投票 0

pandas python 中基于行的过滤器和聚合

我有两个数据框如下 df1: 数据1 = { 'Acc': [1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 3, 4], 'indi_val': ['Val1', 'val2', 'Val_E', 'Val1_E', 'Val1', 'Val3', 'val2', 'val2_E', 'val2...

回答 1 投票 0

在快速 DataFrame 中前向填充或后向填充 nil 值

寻找一种在快速 DataFrame 中转发或回填 nil 值的方法。我已经找到了一种方法来向前填充一个零值,但不能连续填充多个零值。我不认为很快...

回答 1 投票 0

Pandas:获取特定数据类型的 value_count

如何检索特定数据类型的值计数? 尝试了多种使用索引标签的方法,最终出现关键错误。 为了获得结果,最终创建了一个数据类型为 nam 的新数据框...

回答 1 投票 0

如何在传递输入时查找前 n 个相关项及其在 pandas 数据框中的值

我是 pandas 的新手,并试图在提供索引时获取前 n 个相关项目。 例如,在下图中,如何获取持续时间的所有相关项目 相关矩阵 我生成...

回答 1 投票 0

如何在 R 中的一列中合并具有重复名称而另一列中具有不同结果的数据框?

我有一个很大的R data.frame,其中第二列中有重复的化学名称,具有不同的“结果”和“使用”值。我想合并这些,所以我有一行......

回答 2 投票 0

将R中的数据框更改为sf对象,以便可以通过tmap绘制

我如何转换下面的示例数据帧。那么它创建了一个可以由 tmap 绘制的空间对象? 该数据包含两个地方当局区(英国)区域 - 康沃尔郡和哈特尔普尔......

回答 2 投票 0

写入排序数据框时,排序顺序未反映在 Excel 中

在这个Python程序中,我正在读取一个Excel文件,并根据程序中定义的特定排序顺序对其进行排序。我想用排序后的数据替换原始文件的内容。

回答 1 投票 0

性能警告:添加更多列时,DataFrame 高度碎片化

在数据框中插入新列(这些列是现有列的移位副本)时,我收到此警告。我怎样才能重写这段代码以避免警告?我发现的一个解决方案是警察...

回答 2 投票 0

提取 : 和预定义字符串集中的字符串之间的子字符串

我有以下输入作为 df 的一列,每一行都是一个字符串: 姓氏:Chardon 名字:Marie 职业:同上 链接:fille 年龄:30 姓氏:Lhopital 名字:Louis-Jean 职业:sp

回答 1 投票 0

当小数秒的格式不一致时,如何将 Pandas 数据框列转换为日期时间?

我有一个 Pandas 数据框,如下所示: 将 pandas 导入为 pd df = pd.DataFrame({'datetime':['2000年1月20日 12:00:00', '2000年1月20日 12:00:00.5', '2000年1月20日 12:00:01']}) df

回答 2 投票 0

根据上一行/下一行删除 df 中的重复值

考虑这个 df: 将 pandas 导入为 pd d = {"a":["居住权", "公民身份", "公民身份","居住权", “公民身份”,“

回答 1 投票 0

合并相同的列名数据并使其成为单个数据框的单个数据

我的数据框 ABC 中有以下几列。 用户标签 用户标签 两者同名 我需要将两者合并并将其作为单列 userLabel。 例如,如果我有以下数据 用户标签 = ['a...

回答 2 投票 0

删除类别值过多的列

我有一个如下数据集: 数据<- data.frame( Col1 = c("id1", "id2", "id3", "id4","id5", "id6", "id7", "id8"...

回答 5 投票 0

如何在 pandas 中对重复数据进行分组求和,同时保留其他列

我有一个数据源,大约如下所示: 可用位置 出售名称 local_id more_data 0 1001 - BBB 1 0 阿尔法 24 'DJQ3DD3y' 1 1001 - B...

回答 2 投票 0

如何在连接两个数据集时获取最新行,并且最新行应小于数据集“A”中的日期[重复]

考虑我有一个数据集,其中有一个每天生成的日期列,如下所示。 DF_A ID 名称 数量 日期 1 abc 20 17/01/2022 1 abc 10 18/01/2022 2 定义...

回答 1 投票 0

如何对 pandas 中的重复数据进行分组求和——同时仍保留其他列

我是熊猫新手,正在努力解决一些数据争论问题。 我有一个数据源,大约如下所示: 可用位置 出售名称 local_id more_data 0 100...

回答 1 投票 0

如果值不存在,则通过对列进行分组来追加新行[重复]

我想通过对年份和月份进行分组,每个年份和月份都有不同的帐户,如果该帐户在该年和月份不存在,则该值将为0。 我该如何解决这个问题?

回答 1 投票 0

如何固定时间序列数据中的第一个值

我的问题很简单,因为我是初学者。我有以下问题。 我有 2 天的股票价格数据,有 7 个时间点,即 14 行。 DataFrame 列是 DATE、Time_IDX 和 P...

回答 1 投票 0

如何与 QVector 配合使用<QVector<float_t>>。优化的方式是什么? [已关闭]

我正在使用 Qt C++,尝试使用 QVector 来存储 4 个交错通道文件中的数据,并在后文中使用它。 我尝试过类似的方法,但仍然不确定如何存储每个chan...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.