data.table 相关问题

R data.table包是为快速内存数据分析而构建的data.frame的扩展。使用带有Shiny(DT)的DataTables包的dt标签。

来自文本值的二进制列

示例数据:df_stock2

回答 1 投票 2

如果列值重复,则根据多个条件保留行,否则保持行

我想将数据表子集化,以根据日期和其他两列(id和类型变量)的条件值包含记录。但是,如果每个id只存在一条记录,则无论如何......

回答 3 投票 1

运行长度编码和分组依据

我仍然不习惯使用data.table的功能。我的目标是在使用多个变量进行分组时使用rle()或rleid()。 rle()不是典型的汇总统计量。在我的测试数据集中......

回答 1 投票 1

加入数据框中具有相似(但不相等)值的行

我有一个像:SampleID Chr Start End Strand Value 1:rep1 1 11001 12000 - 10 2:rep1 1 15000 20100 - 5 3:rep2 1 11070 12050 - 1 4:rep3 1 ...

回答 1 投票 1

删除单个单元格中的重复ID

我在R中有一个包含多个列的数据表,其中一列的ID由“//”分隔。有些是重复的,我需要删除重复项并保留唯一ID。列3中的第1,2,5行......

回答 2 投票 -1

如何读取R中的多个csv文件并使用fread函数跳过最后一行

我试图使用fread函数读取多个文件(csv)。但是在最后一行我有不必要的数据,我无法使用fread,因为它抛出错误。代码:library(data.table)fnames&...

回答 1 投票 4

根据组,按两列计算唯一行数

我有一个data.table在r col1 col2 col3 col4 1:5.1 3.5 1.4丝滑2:5.1 3.5 1.4丝滑3:4.7 3.2 1.3丝滑4:4.6 3.1 1.5丝滑5:5.0 3.6 1.4丝滑6:5.1 3.5 3.4 ...

回答 1 投票 6

如何使用data.table计算组内的不同组合? [重复]

我想计算某个组中data.table中列组合中不同值的数量。简单的例子:数据看起来像房间|对象----------------------- ...

回答 1 投票 2

从R中的两个类别向量创建数据表[重复]

我想使用以下向量创建一个新的数据表。我有两个表,一个包含100个人的列表,以及一个包含5个测试的列表。我想组合表格,但是,我希望每个测试都有一行......

回答 2 投票 1

通过引用将结果列表分配给data.table的多个列

想象一下,由于存储在data.frame中的两个模拟产生2个分布:sim1 = 1:10 sim2 = 91:100 sim = data.frame(sim1,sim2)现在,我们想要找到10%和90%的百分位数...

回答 1 投票 0

数字和索引向量到data.table

将以下向量放入data.table以及每个数字的索引的最佳方法是什么? nVector

回答 2 投票 8

R Shiny列标准

我有一段代码允许上传CSV文件,转换成数据表,然后显示回主面板中的UI。收集并发送列/变量名称......

回答 1 投票 0

每当字符出现在data.table对象中时填写一个值

我有一个data.table对象,基本上我想做的是每当出现特定的ID_Type和BUYER / SELLER字符值时更新数据表。举个例子,我有一个data.table给出...

回答 3 投票 0

在Dataframe中计算,保留第一行作为参考

对于N列,我的第一行是添加以下行的参考值。数据A B C D 3 5 1 2 1 4 5 3 2 2 2 4 3 1 3 1 4 3 1 2计算......

回答 3 投票 0

基于不同表的行值对表中的列值求和

我想基于不同表DT1的行值对表DT2中的列值求和,并将其存储在DT3库(data.table)DT1中

回答 2 投票 2

如何根据每周日期创建移动平均线,按data.table中的多列分组?

我正在读取一个非常大的数据集作为data.table的速度。相关列是DATE(年 - 月 - 日字符串中的每周数据,例如“2017-12-25”),V1(整数),V2(字符串),V3(数字)。 ...

回答 2 投票 0

在data.table中具有指定变量的引用列

我想将数据表中的列从因子转换为数值,但是我正在使用“字典”(列表),因此我希望能够通过“字典”引用列变量: ..

回答 2 投票 0

根据多列中的行创建/更新列

我创建了一个以下data.table对象; V1 V2 V3 V4 1:693 -0.2842529 1.3710 21.64843 2:240 -2.6564554 -0.5647 93.37038 3:43 -2.4404669 0.3631 92 ....

回答 2 投票 1

使用带时间戳的行程编码

我的目标是使用rle()函数来找出自行车站已空的时间。使用下面的测试数据,rle(测试$ bikes)将返回测试$ bikes中的重复值的长度。 &...

回答 2 投票 1

根据data.table中其他列中的计算值计算列中的滚动总和

我试图从另一列的计算值计算列中的值。 DT

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.