data.table 相关问题

R data.table包是为快速内存数据分析而构建的data.frame的扩展。使用带有Shiny(DT)的DataTables包的dt标签。

使用 data.table 中的列名称选择多个范围的列

假设我有一个数据表, dt = data.table(矩阵(1:50, nrow = 5)); colnames(dt) = 字母[1:10]; > DT abcdefghij 1:1 6 11 16 21 26 31 36 41 46 2:2 7 12 17 22 27 32 ...

回答 3 投票 0

在R中安装data.table库:zlib.h没有这样的文件或目录

我想在R中安装data.table库,但是我遇到了问题。 当我打字时 install.packages(“数据.表”) 它告诉我必须从源代码编译该库。如果我说是,我的 C

回答 1 投票 0

如何使用文本表达式对数据进行子集化

假设我读取了一些包含要在数据集中进行的操作的文件,作为示例 库(数据.表) dt = setDT(mtcars) exp1 =“气缸 == 8 & mpg > 16” exp2 = "圆柱== 6 &...

回答 1 投票 0

如何重命名 data.frames 列表中的重复变量?

我想使用map2重命名列表中包含的数据表的几个重复的变量名称“NA.”,以便列名称不重复。这个问题已被问过(重命名失败

回答 1 投票 0

data.table 和 dplyr 兼容性

当我同时使用 data.table 和 dplyr 时,我遇到了一些奇怪的错误。 我有的包是: 数据表:'1.12.2' dplyr: '0.8.3' 如果我回滚到旧版本,则不会发生错误。如果我只使用 dplyr...

回答 0 投票 0

按组将 R 数据框中的值向上移动

我在 R 中有一个数据框,我需要使用数值将特定列中的值向上移动。用作输入以向上移动值的数值与组关联...

回答 1 投票 0

当数据未通过 R 函数中的某些检查时将数据分配给列表

我正在使用一些测试数据在 R 中创建一个函数,该函数将循环遍历 data.table 并检查每一列是否符合特定条件。该函数应根据已知的列对列进行分组...

回答 1 投票 0

用非 NA 值替换前一列中的先前 NA,同时保留后面列中出现的 NA

在 data.table 中,我想用最接近的先前非 NA 值向前填充先前的 NA,类似于这篇文章 但是,我想保留非 NA 值之后出现的任何 NA。那个。

回答 2 投票 0

用最新的非 NA 值替换先前的 NA,同时保留后续的 NA

在 data.table 中,我想用最接近的先前非 NA 值向前填充先前的 NA,类似于这篇文章 但是,我想保留非 NA 值之后出现的任何 NA。那个。

回答 1 投票 0

R data.table 在多个同名列中按列名选择特定列

尝试通过列名选择特定的DT列,但该DT有多个同名列: DT = data.table(a=1:3, a=4:6, a=7:9, b=10:12, a=13:15) > DT 甲乙乙 1: 1 4 7 10 1...

回答 1 投票 0

使用 by = 数据表的每一行

我有一个数据表,我正在尝试创建一个新变量,它是所有其他列的函数。一个简化的例子是,如果我只是想对所有 r 求和或取平均值...

回答 3 投票 0

数据表A左连接数据表B,如何将B的所有列名包含在结果中?

数据表A左连接数据表B,如何将B的所有列名包含到结果中? 表详细信息是: >表_详细信息_s<- data.table(table_name = 'dtA',col_name = c("lc","...

回答 1 投票 0

在 data.table 上使用 geosphere distm 函数来计算距离

我创建了一个包含 6 列的 data.table。我的 data.table 有一个列比较两个位置:位置 1 和位置 2。我正在尝试使用 distm 函数来计算距离...

回答 2 投票 0

R 目标:分支大于内存对象的最佳策略

我有一个 {targets} 管道,可以下载数千个气象站数据。为了有效地做到这一点,我使用动态分支和工作人员进行并行工作,并以 station-id 作为模式。 数据...

回答 1 投票 0

R data.table - 通过聚合满足条件的其他行来更新每一行

我有下表。 dt = data.table(id = 1:5, intMask = c(11,14,8,1,13), 印记 = c("1011", "1110", "1000", "0001", "1101" ), N = c(3,3,1,1...

回答 1 投票 0

使用data.table计算运行金额不会计算没有值的天数?

我有两个数据框,其中包含两个不同年份的值,按组分类,我想将它们组合在一起以计算每组的运行金额,同时填写缺失的日期。这里...

回答 1 投票 0

如何使用sql、python或r整合缓慢变化的维度表?

我有以下输入表: ID 类型 价值 日期_从 日期到 1 部门 金融 2020-01-01 9999-12-31 1 人数 10 2020-01-01 2020-02-03 1 人数 15 2020-02-04 9999-12-31 1 地点 直流 202...

回答 1 投票 0

如何加速在数据子集上拟合线性混合模型?

我正在尝试为数据集中所有可能的因素组合拟合线性混合模型。由于运行时间太长,我确实需要优化我的代码。 为了说明...

回答 1 投票 0

如何对 data.table (R) 中的 2 组列进行不同的汇总?

我有一些足球代码,使用每周更新的数据集,现在它们已经变成非常大的数据框,我需要将它们转换成数据表。 问题出在这部分...

回答 1 投票 0

通过按多个变量分组来执行locfit并绘制图表

我有一个数据: 图书馆(locfit) 一个<- c("A", "A", "A", "A", "A","A","A","A","A","A","A","A", "B", "B", "B", "B", "B","B", "C", "C", "C", "C", "C","C","C...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.