dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

PySpark 数据帧与标题不匹配

我有一堆在 6 个月内编写的 parquet 文件,按创建日期和时间进行分区。在这 6 个月里,标题发生了变化,因此

回答 1 投票 0

根据行不同的列合并R Data.Frame

我有两个数据框,如下所示: DF1: ` ID ID_T1 ID_T2 ID_T3 ID_T4 1 101 不 不 不 不 2 102 11111 11111 11111 11111 3 103 22222 22222 不适用 不适用 4 104 不不不不不...

回答 1 投票 0

相当于 pandas 的 `shift`

Pandas 中的初始数据框 假设我们在 Python 中使用 pandas 有以下内容: 将 pandas 导入为 pd df = pd.DataFrame({ “第 1 列”: [10, 20, 15, 30, 45], “第2栏”:[13...

回答 2 投票 0

Scala - 将地图转换为数据框,其中键是列标题

我希望使用地图创建一个数据框,使得地图的键是列标题,地图的值是数据本身。在 python 和 pyspark 中,这可以很容易地完成

回答 1 投票 0

在具有自定义函数的数据框中使用.assign

早上好 我有一个问题,非常感谢您的帮助/建议。我正在尝试在数据框中创建一列并传递一个自定义函数,该函数将后缀分配给日期...

回答 1 投票 0

向大型数据框添加索引是否会使查找更快

我是 pandas 新手,正在我的代码中使用 pandas 数据帧。数据帧非常大(包含超过 2M 行)。我没有向数据框添加任何索引。其中一项价值...

回答 3 投票 0

计算双组中位数并按中位数降序排列的R代码

我有一个由 3 列组成的数据框:站点、程序、结果。这是一个最小的重现数据集: > TP <- data.frame(Site = as.factor(c("Coal", "Coal", "Coal", &...

回答 1 投票 0

python 脚本将文件的每一行解析为 excel

我正在开发一个Python脚本来将文件的每一行解析为Excel表。目前,我的脚本正在将数据提取到单列多行的 Excel 中。我担心的是...

回答 1 投票 0

Python中基于条件的累加向量重置

我试图在满足所需条件时重置总和的累积,所有这些都以矢量化方式进行,而不使用循环。我将首先展示一个简单的示例,然后展示真正的问题。 进口...

回答 1 投票 0

Python TypeError:无法连接类型为“<class 'str'>”的对象;仅 Series 和 DataFrame 对象有效

我收到以下错误: 类型错误:无法连接“”类型的对象;仅 Series 和 DataFrame 对象有效 回溯(最近一次调用最后一次): 文件“/var/...

回答 1 投票 0

Python Polars:如何获取 LazyFrame 的行数?

我的 CSV 文件大小为 70 GB。我想在惰性模式下加载 DF 并计算行数。最好的方法是什么? 据我所知,lazy m 中没有像 shape 这样的函数...

回答 2 投票 0

如何从 Pandas 数据框中制作多列的多个图?

假设我有一个像这样的数据框,其中包含年份、月份、最大值、最小值: 年 月 最大组合 2000年 1 3.0 0.30 2000年 2 3.7 0.70 2000年 3 3.6 0.60 2001年1 2.4 1.40 2001...

回答 1 投票 0

ggplot2 中的长格式数据的折线图和点图

在下面的数据中,我只需在 x 轴上绘制年份(一个因素),在 y 轴上绘制出勤率(一个数字),并根据组对线条进行颜色编码。 然而,情节是如此的古怪。一个...

回答 1 投票 0

Julia 中的数据帧爆炸

我有一个像这样的 Julia 数组: 任意[任意[["link_1", "link_2", "link_3"], "82", ["A B", "C D", "E F", "G H", "I J&...

回答 1 投票 0

错误 AttributeError:“DataFrame”对象没有属性“append”,尝试了 pd.concat 但也导致错误

收到错误 AttributeError: 'DataFrame' 对象没有属性 'append 当尝试运行以下命令时: new_df.append({'Obs_Date': day_row['Obs_Date'], 'From_Currency': day_row['From_Curren...

回答 1 投票 0

我在 Pandas 中“groupby”的列会发生什么?它仍然存在于新的数据框中吗?

假设我有一个带有“A”列的数据框 df1。我按操作分组 df2 = df1.groupby(["A"]).sum() 创建一个新的数据框 df2。 当我显示新的数据框 df2 时,我可以...

回答 1 投票 0

迭代多个数据帧

##1 M_成员 = [1000, 1450, 1900] M = pd.DataFrame(M_members) ##2 a_h_members = [0.4, 0.6, 0.8] a_h = pd.DataFrame(a_h_members) ##3 d_h_members = [0.1, 0.2] d_h = pd.DataFrame(d_h_m...

回答 4 投票 0

在面板 RStudio 中选择最近的日期

我有一个数据框,它是一个面板:我有不同的 CLP(就像事件的 ID)重复多次,每个阶段对应事件的每个阶段:组织、设置、开始、结束、清理-向上。 每个...

回答 1 投票 0

栏中间文字自动调整

我有一个名为 df 的数据框: df = tibble(var =c("A","B","C","D","E"), val = c(2,8,9,1,5) );df 结果是: 瓦尔瓦尔 我有一个名为 df 的数据框: df = tibble(var =c("A","B","C","D","E"), val = c(2,8,9,1,5) );df 导致: var val <chr> <dbl> 1 A 2 2 B 8 3 C 9 4 D 1 5 E 5 我想水平绘制 val 列的条形图,并将每个类别的值以文本形式绘制在条形图中间。 ggplot(df, aes(x = var, y = val)) + geom_bar(stat = "identity", fill = "lightgrey") + coord_flip() + # This flips the coordinates to make the bars horizontal geom_text(aes(label = val)) 导致: 如何将值(文本)自动放置在水平条的中间? 您可以使用 position = position_stack(vjust = .5) 将标签放入条形中间: library(ggplot2) ggplot(df, aes(x = val, y = var)) + geom_bar( stat = "identity", fill = "lightgrey" ) + geom_text( aes(label = val), position = position_stack(vjust = .5) ) 除以2: ggplot(df, aes(x = var, y = val)) + geom_bar(stat = "identity", fill = "lightgrey") + geom_text(aes(x = var, y = val/2, label = val)) + coord_flip() 在基地 X = data.frame(var =c("A","B","C","D","E"), val = c(2,8,9,1,5)) with(X, { barplot(val, horiz=TRUE, names.arg=var, las=2L, xaxt="n") |> text(x=val/2L, labels=val) axis(side=1L, at=seq(0L, max(X$val), 2.5)) } )

回答 3 投票 0

栏中间文字自动调整

我有一个名为 df 的数据框: df = tibble(var =c("A","B","C","D","E"), val = c(2,8,9,1,5) );df 结果是: 瓦尔瓦尔 我有一个名为 df 的数据框: df = tibble(var =c("A","B","C","D","E"), val = c(2,8,9,1,5) );df 导致: var val <chr> <dbl> 1 A 2 2 B 8 3 C 9 4 D 1 5 E 5 我想水平绘制 val 列的条形图,并将每个类别的值以文本形式绘制在条形图中间。 ggplot(df, aes(x = var, y = val)) + geom_bar(stat = "identity", fill = "lightgrey") + coord_flip() + # This flips the coordinates to make the bars horizontal geom_text(aes(label = val)) 导致: 如何将值(文本)自动放置在水平条的中间? 除以2: ggplot(df, aes(x = var, y = val)) + geom_bar(stat = "identity", fill = "lightgrey") + geom_text(aes(x = var, y = val/2, label = val)) + coord_flip() 您可以使用 position = position_stack(vjust = .5) 将标签放入条形中间: library(ggplot2) ggplot(df, aes(x = val, y = var)) + geom_bar( stat = "identity", fill = "lightgrey" ) + geom_text( aes(label = val), position = position_stack(vjust = .5) )

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.