dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

将日期时间数据绘制为月份而不是月年

我有一个如下所示的数据框: 结构(列表(日期 = 结构(c(1592611200, 1624665600, 1626480000, 1620086400、1624147200、1624752000、1626566400、1.566e+09、1621036800、 1651536000),...

回答 1 投票 0

在数据框中,将具有多个条件且不在同一行的一列中的值替换到另一列

我正在尝试将值从数据框中的一列传输到另一列,具有多个条件并且不在同一行中。 从列“BEGUZ_H”和“ENDUZ_H”到列“BEGUZ”的值...

回答 1 投票 0

查找数据框中每天的一系列日期时间的平均温度

这是我拥有的数据框的子集: 结构(列表(名称 = c(“华尔道夫”,“华尔道夫”,“华尔道夫”,“华尔道夫”, “华尔道夫”、“华尔道夫”、“

回答 1 投票 0

如何根据标题对数据框中的项目进行分类?

我有一个数据框,我想根据其标题将能源相关项目分为 4 个不同的主题。 为此,我想使用预定义的关键字来识别项目的主题

回答 1 投票 0

avg() 在整个数据帧上导致不同的输出

我看到 dataframe.agg(avg(Col) 工作正常,但是当我在整个列的窗口上计算 avg() 时(不使用任何分区),我根据与 orderBy 一起使用的列看到不同的结果。 ...

回答 1 投票 0

如何在 pyspark dataframe 中使用 xpath 从 xml 文档获取嵌套 xml 结构作为字符串?

我有一个数据框,其中包含带有 XML 字符串的字符串数据类型列。现在我想使用原始列的嵌套 XML 结构创建一个新列。为此,我尝试在 PySpark 中使用 XPath。 S...

回答 1 投票 0

从 HTML 中抓取数据 [已关闭]

这是我想要抓取的页面,http://www.footballlocks.com/nfl_point_spreads_week_1.shtml,我想最终得到一个包含 4 列的简单 data.frame,以便我可以执行进一步的分析。 ...

回答 2 投票 0

优化数据帧列的大量矩阵乘法

我正在编写一段代码,根据飞机的方向和全局速度矢量来计算飞机的迎角和侧滑角。我的所有数据都保存在数据框中。至

回答 1 投票 0

如何从不同的数据框中按列过滤数据框?

我想用来自不同数据帧的字符串按列过滤数据帧。 val booksReadBestAuthors = userReviewsWithBooksDetails.filter(col("authors").isin(userReviewsAuthorsManyRead:_*...

回答 1 投票 0

通过匹配列/索引名称,使用另一个数据框中的字符串值重命名Python中的数据框列

主要修改: 显然很难理解我的问题,所以我会尽力将其具体化。 我有两个数据框,“df1”和“df2”。这些相当大,比...

回答 1 投票 0

如何在极坐标数据帧上重新排序重复答案

我有一个包含多个问题和答案的 Polars 数据框。问题是每个答案都包含在自己的列中,这意味着我有很多冗余信息。那里...

回答 1 投票 0

如何在 python/pandas 中的两个数据帧之间执行涂抹?

我有两个数据帧,我需要执行涂抹(如果这就是通常所说的)。基本上第一个较小(500 万行),另一个是 4000 万行。我想添加...

回答 1 投票 0

如何按组统计以逗号分隔的条目总数

我正在处理英雄联盟冠军数据集 姓名 标签 亚托克斯 战斗机 阿赫里 法师、刺客 阿卡丽 刺客 阿克尚 射手、刺客 阿利斯塔 坦克、支援 我想知道如何...

回答 3 投票 0

Polars - 使用另一个 DataFrame 的行过滤 DataFrame

我有两个数据框 - 具有相同模式的图形和搜索 图的架构: 架构 = { START_RANGE:pl.Int64, END_RANGE:pl.Int64, } 搜索架构: 架构 = { 开始:pl.Int64...

回答 1 投票 0

如何比较两个 Pandas 数据框中的列表以获得共同元素?

我想将 df_2 中 set_1 和 set_2 列的列表与 df_1 中 ins 列进行比较,以找到所有公共元素。 我已经开始做一行一列,但我不知道如何比较......

回答 1 投票 0

列表输出被截断 - 如何在 R 中使用 str() 扩展列出的变量

我有一个包含 600 多个变量的 data.frame df 。 我正在编写一个自动创建列的函数,并且需要对它们进行一次目视检查。 str 函数提供了一个很好的总结: str(df)...

回答 4 投票 0

如果混合在一列中,如何计算一组的总条目

我正在处理英雄联盟冠军数据集 姓名 标签 亚托克斯 战斗机 阿赫里 法师、刺客 阿卡丽 刺客 阿克尚 射手、刺客 阿利斯塔 坦克、支援 我想知道如何...

回答 1 投票 0

根据与特定列的比较在 R tidyverse 中创建大量列

我在 R tidyverse 中有一个数据集,我想根据与 sp 列的比较创建 192 列,就像 mp_comp_1 列一样。如何对 tidyverse 中的 192 列执行此操作? 图书馆(整洁...

回答 1 投票 0

使用 pandas 将数据帧减去子数据帧

我有一个大数据帧,我想根据两个条件将该数据帧减去为较小的数据帧。下面是数据框的一小部分: | | id |结果| | -...

回答 1 投票 0

Pandas 数据框 groupby 应用具有可变参数数量的函数

我有一个pandas数据框,看起来像 将 pandas 导入为 pd 数据 = { “比赛ID”:[2,2,2,2,2,5,5,5,5,5,5], “学生ID”:[1,2,3,4,5,9,10,2,3,6,5], “theta”:[8,9...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.