R data.table包是为快速内存数据分析而构建的data.frame的扩展。使用带有Shiny(DT)的DataTables包的dt标签。
我有以下数据表: DT <- data.table(id=c("A","A","B","B","C","C"),condition=c(1,2,1,2,1,2),value=c(0,1,1,3,2,2)) For each
如何将R中的两个melt/gather/pivot_longer命令合并为一个命令?
我有一个我理解的相当简单的问题,但到目前为止我找不到解决方案。 我有一个数据集,其中有 4 列以时间 (time1, time2...) 开头,4 列以 cou... 开头
我有数据整理脚本,我只想用上面的值填充所有 NA。我曾经这样做过: 库(数据.表) 第 1 列 <- c("A", "B", "C", &qu...
假设我有一个向量,其中包含a中的一系列半径,以及circle_stats中从1到30的半径的面积和周长。我想对 Circle_stats 进行子集化,使行与这些行匹配...
我有一个非常大的数据库(超过3000万条记录),其结构如下: 测试<- as.data.table(list(v1 = c("150,10001,11,Bien", "151,10002,11,Bien", "152,
data.table 的 GForce - 将多个函数应用于多个列(带有可选参数)
我的目标是将多个函数应用于多个列并打开 GForce。 假设我有以下数据框 库(数据.表) df <- data.table(fruit = c('a', 'a', 'a', 'b') ...
使用 data.table R 计算新列,给出其他列的趋势/斜率
我在 R 中有一个非常大的表,其中的数字列给出了几年的值。它看起来像这样,但有更多的列和数百万行。 id 年1 年2 年...
我有两个 data.tables(以标准化形式表示同一实体的行),每个表中的行数不同,并且具有 update_at 时间戳。我想通过
我有一个 R 时间序列数据表,其中包含年份、位置、物种和人口计数列。 我一直在尝试找到一种方法来删除其中的时间序列(或仅年份)
我只想获取 data.table 中行之间的差异,使得 diff[n] = value[n] - value[n-1]。 我目前尝试使用 Zoo::rollapplyr 来实现这一目标: 库(数据.表) dt <- fread(text = &
在 Windows 中使用 R data.table fread 按第 N 列过滤行
我有一个很大的数据集,我想通过使用 cmdargument 仅过滤某些行来对其进行预处理。不幸的是,原始文件的过滤信息位于第三列,而不是第一列......
我正在尝试将两个数据集放在一起,但似乎遇到了问题。 这是我的第一个数据集: 头(合并分析) # 小题:6 × 13 squirrel_id 网格性别 年龄组 年龄组 年
有没有好的方法来获取 data.table 中 i - 参数的整个长度?
有没有一种好方法可以找出 data.table 中正在处理的整个数据的长度,就像使用 .N 返回组的长度一样? 我给你举个例子: 库(数据.表) dt <...
我有两个DT X = data.table(名称 = c("a", "a", "b", "b", "c", "c"), 年 = c("2001", "2002", "2001" ,&q...
data.table 分组集中出现警告消息“min 没有非缺失参数;返回 Inf”
我正在测试 data.table::groupingsets 并且不断收到意外警告。 首先,我创建一个数据表用作输入: ## 创建“长”虹膜数据集 长虹膜 <-melt(as.data...
给出以下年龄界限(以年为单位): 来自_i <- 20.2345 to_i <- 22.0000009 which is a compact and elegant way to generate the following data.table? from_i_integer <- trunc(from_i)
我正在尝试使用 fread 读取文件,并根据索引和列名称选择列。我可以使用 dplyr 执行此操作,但不能使用 data.table 执行此操作。刚学后者。知道怎么做吗? ...
此博客上有一个示例(非附属): 比较 R (tidyverse) 和 python (pandas) 的数据操作(组、过滤器、 总结)。 最简单的示例是一个包含三列的表格:
在 R 中为大型 DataFrame 中的相关行高效分配通用 ID
我正在使用 R 中的大型数据集,包含大约 1900 万行和超过 81 列,我需要一些指导来有效处理它。 我的数据集跟踪重复出现的记录...
给出以下年龄界限(以年为单位): 来自_i <- 20.2345 to_i <- 22.0000009 which is a compact and elegant way to generate the following data.table? from_i_integer <- trunc(from_i)