dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

无法使用 Places API 替换数据集的地址值

我在将地址列的原始值替换为从 Places API 响应中获取的地址时遇到问题。尽管代码及其响应一帆风顺,但有些事情必须......

回答 1 投票 0

关于使用R STUDIO过滤不同长度的数据

我有 1000 行和 800 列的数据集。我想过滤每列中的非零值,并准备一个每列中仅包含非零值的新数据集。问题是每个c...

回答 1 投票 0

在具有多个分类代码的列条目中过滤数据框以查找分类代码的第一个字母

我正在尝试将专利数据框过滤到其分类代码中。我只想获取代码中具有特定首字母的专利,但每个列条目都有多个这样的专利

回答 1 投票 0

如何将一个数据帧的值添加到另一个数据帧,并由接收数据帧进行双重条件?

我正在尝试以一种特定的方式合并两个数据帧。它们都类似于以下两个: df1 <- data.frame(Countries = c("Portugal", "Andorra", "Spain", "

回答 1 投票 0

如何将数据框列中的对转换为两个新列

我一直在尝试采用像下面的 df 这样的 DataFrame,并将一些列(例如 B_m 和 B_n)变成两列(称为 B_m1、B_m2、B_n1 和 B_n2),对于其中的每一对值专栏...

回答 2 投票 0

根据另一列中的时间限制递增行块的编号

我有一个包含 3 个字段的 df,如下所示,我希望根据挑选开始时间增量生成班次编号。 如果选择22:00到0600之间的开始时间,则为班次1;然后迭代所有

回答 1 投票 0

创建新列并从现有列的值中分配它们的值[重复]

我从 Kaggle 下载了一个用于我的项目的数据集,我想创建新列并根据现有列分配它们的值。 我的实际数据集很复杂,我会给出一个类似的...

回答 1 投票 0

使用子集与 dplyr::filter 的不一致

我有一个数据框,根据使用的过滤方法给出不同的结果。请参见下面的屏幕截图,这看起来很奇怪。对于为什么会这样有什么想法吗?

回答 1 投票 0

提高我的分类 f1_score - pandas/sklearn

我想了解如何提高分类的 f1_score 的建议。我目前的数值约为 0.57。数据集: lotWaferDie - 测量缺陷的批次、电路板和芯片 字符串值...

回答 1 投票 0

基于多列 pandas 的分组依据和总和的运行总计

我正在使用以下数据集,但在根据团队 ID 计算总分时遇到了麻烦。一支球队可以是主场也可以是客场,我正在计算他们的总计......

回答 1 投票 0

查找由另一列分组的列的唯一性

我正在尝试对我正在使用的代码库中以下函数的功能进行逆向工程: def _helper(df): return (df.groupby(['a', 'b', 'c']) 。尺寸() .

回答 1 投票 0

如何在 Pandas 中旋转数据框? [重复]

我有一个 csv 格式的表格,如下所示。我想转置表格,以便指示器列中的值是新列。 指标 国家 年份 值 1 安...

回答 2 投票 0

在特定列上滞后 n 行,同时扩展数据帧的长度

我试图将数据框中的特定列下移(滞后)n 行(例如2 行)。我只找到了有关特定列滞后 1 行的帖子。这是一些模拟数据。 df <- data.fr...

回答 2 投票 0

如何选择分类特征和数值特征来运行训练测试?

我试图连接两个不同长度的特征列表,这导致了 ValueError,因为两个列表的形状无法一起广播。我试图选择

回答 1 投票 0

Pandas 时间序列分割显示出差距

我将连续的时间序列(按小时计算的功耗)拆分为训练/验证/测试,但在拆分的数据帧中发现了意外的间隙。可能是什么原因? train_split_end = round(len(df) *...

回答 1 投票 0

如何使用 python 显示数据框中包含 NaN 值的记录

我有一个 GUI 界面,在 python 中使用 pyqt5 创建一个窗口,允许用户加载 csv 文件并对其进行处理,打印标题并创建函数,其中一个函数是显示

回答 2 投票 0

如何使用 r 中的 coefplot() 从 glmnet 多项式对象绘制系数?

我正在尝试使用 coefplot 可视化由 glmnet 多项式模型生成的系数估计。我知道,至少,Stata中coefplot的实现支持绘制多项式模型

回答 1 投票 0

用python分割时间序列

我有一些任务,我只是不知道如何解决。我有一个生产步骤的时间序列。现在我想对每个生产步骤进行分段并给它一个 ID。我的时间序列看起来像这样:

回答 1 投票 0

根据标签将一列分隔在不同的列中

我有一个数据集,其中一列有一个字符串作为值。 字符串有这样的方面: F:随便; F:随便;普:随便;普:随便; C:随便; C:随便; 我想分开...

回答 1 投票 0

Python pandas dataframe - 每日数据 - 获取每年的第一天和最后一天

我有一个 Python pandas 数据框,其中包含每日数据,如下所示: 日期 开盘价 最低价 收盘价 调整收盘量 0 2009-12-31 31.709999 31.840000 31.299999 ...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.