data.table 相关问题

R data.table包是为快速内存数据分析而构建的data.frame的扩展。使用带有Shiny(DT)的DataTables包的dt标签。

在计算 data.table 中的行数时包括零计数的因子水平

我想按组计算行数,其中分组变量是一个因素。我还希望将数据中未表示的因子水平(即具有零行)包含在 res 中...

回答 2 投票 0

如何用data.table汇总所有因子水平?

让我们看一个最小的例子: 库(数据表) DT = data.table(x=factor(rep(c("b","a","c"),each=3))) DT[x!="c"][, .N, by = x] ×N 让我们看一个最小的例子: library(data.table) DT = data.table(x=factor(rep(c("b","a","c"),each=3))) DT[x!="c"][, .N, by = x] x N <fctr> <int> 1: b 3 2: a 3 在这个例子中,因为x是一个有3个水平的因素a,b,c,我希望输出是 x N <fctr> <int> 1: b 3 2: a 3 3: c 0 或者有一些论据来控制它。有什么方法可以得到这个输出吗? 谢谢! 使用连接语法 DT[x != "c"][levels(x), on = "x", .N, by = .EACHI] # x N # <char> <int> # 1: a 3 # 2: b 3 # 3: c 0 你可以试试- library(data.table) remove_vars <- c("c") DT[, if(all(x %in% remove_vars)) 0L else .N, by = x] # x V1 #1: b 3 #2: a 3 #3: c 0

回答 2 投票 0

R:如何用data.table汇总所有因子水平?

让我们看一个最小的例子: 库(数据表) DT = data.table(x=factor(rep(c("b","a","c"),each=3))) DT[x!="c"][, .N, by = x] ×N 让我们看一个最小的例子: library(data.table) DT = data.table(x=factor(rep(c("b","a","c"),each=3))) DT[x!="c"][, .N, by = x] x N <fctr> <int> 1: b 3 2: a 3 在这个例子中,因为x是一个有3个水平的因素a,b,c,我希望输出是 x N <fctr> <int> 1: b 3 2: a 3 3: c 0 或者有一些论据来控制它。有什么方法可以得到这个输出吗? 谢谢!

回答 0 投票 0

尝试使用 data.table::dcast() 将我的数据更改为宽格式时出错

我有几个文件正在尝试转换为宽格式。但是,当我这样做时,它将行和列的标题转换为宽格式,但将所有数值更改为 ...

回答 0 投票 0

如何使用 R data.table fread() 函数从压缩文件夹中读取所有 CSV 文件,进行预处理,并在结果中添加具有原始文件名的列?

我有一个压缩文件夹,其中包含许多布局相同的 CSV 文件。在使用保留前四列的 shell 脚本进行预处理后,我正在读取这些文件。我正在使用数据....

回答 0 投票 0

根据条件复制 R 中的行

我写了下面的R代码,但是在大型数据集(100万条记录)上运行需要很长时间。有没有更快的 tidyverse 解决方案? report_range = seq.Date(from = beginni...

回答 0 投票 0

R - 不同的聚合数据表列

我得到了一个大型数据表,需要根据第一列进行聚合: 问题如下: 对于多个列,只需为每个类别形成总和(在

回答 1 投票 0

当一个数据帧的时间戳在另一个数据时间间隔之间时合并数据帧

我有两个数据帧,其中包含 POSIXct 格式的时间数据和我需要匹配的相应位置。一个数据集包含一系列 30 分钟的时间段以及位置数据。 位置

回答 2 投票 0

在 for 循环中广播多个数据帧

所以我有多个数据框,遵循以下模式: df1<-data.frame(id=c("1","2","1","2"),choice=c(1,1,1,2)) df2<-data.frame(id=c(...),choice=c(...)) df1 id choice 1 1 1 2 ...

回答 1 投票 0

返回所有行组合,其中两个数字列的总和每个总和 > 0 组合并具有公共索引列 [R]

我想返回 comboindex(第 1 列)的所有组合,其中 rowA 中的 number1 和 rowB 中的 number1 的总和> 0 以及 rowA 中的 number2 和 rowB 中的 number2 的总和> 0,以及 indexa,ind。 ..

回答 2 投票 0

返回所有行的组合,其中每行两个数字列的总和> 0并且具有公共索引列[R]

我想返回 comboindex(第 1 列)的所有组合,其中 rowA 中的 number1 和 rowB 中的 number1 的总和> 0 以及 rowA 中的 number2 和 rowB 中的 number2 的总和> 0,以及 indexa,ind。 ..

回答 1 投票 0

返回 data.frame 行的所有组合,其中每行两个数字列的总和 > 0,并且具有公共索引列 [R]

我想返回 comboindex(第 1 列)的所有组合,其中 rowA 中的 number1 和 rowB 中的 number1 的总和> 0 以及 rowA 中的 number2 和 rowB 中的 number2 的总和> 0,以及 indexa,ind。 ..

回答 0 投票 0

在 i 中使用 `.I` 来选择行 [关闭]

我尝试在 i 中使用 .I 来索引数据表,但结果是“Null data.table”。我想知道这是否是预期的行为。 创建数据: dt = data.table(a = rep(LETTERS[1:5], each = 5), ...

回答 0 投票 0

如何使用数据表新建一张表,显示满足条件的行数比例?

我正在尝试使用数据表来查看每列,有多少行满足条件(占总行数的比例)并将其包含在输出表中,因此每列有 1 个 obs ...

回答 1 投票 0

交易日期前6个月的总金额

这是我的交易数据。它显示了从 from 列中的帐户到 to 列中的帐户进行的交易以及日期和金额信息 数据 编号从...

回答 4 投票 0

data.table 通过引用赋值和通过<- in one line

这与引用分配的注释部分相关,使用:= 如果该值被分配给一个名称,那么如果该名称之后直接输入控制台,则不会显示任何输出。进入...

回答 0 投票 0

How to do ranges with string data type in R data.table?

下面是一个示例数据集(A 列和 B 列),我想创建一个新的标志列 C 以将第 3 行到第 8 行分组到“91345-912350”范围内(在真实数据集中,我有多个

回答 3 投票 0

使用 data.table R 一次对多个因子变量进行排序

我如何在 R 中一次无序多个因素? 我只想与 data.table 对象分享我的解决方案。 玩具数据集: dt<-data.table( variable1 = 1:5, variable2 = c(1,2,5,6,8), variabl...

回答 3 投票 0

删除 R 中的重复行

我正在尝试通过删除不包含其他信息的行来减小文件的大小。我观察到我有一些行,其中出价和要价不会从一个时期到下一个时期发生变化...

回答 1 投票 0

列值作为列名并填充其他列值

我有一个表格如下: 自由<- data.table(ID = c(1,2,3,1,2,1,1,2,3), vlaue = c("A", "B", "C", "A", "B", "A", "...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.