我有两个数据集:OriginalPTs和RetestPTs。每个都有三列,PID,速度和组。组是“原始”组还是“重新测试”组,具体取决于哪个数据帧。 RetestPTs $ PID的所有值都在OriginalPTs $ PID中,但是OriginalPTs $ PID包含我不想使用的其他条目。
我想创建一个由PID,速度和组组成的新数据帧,但仅针对在两个原始数据帧中都找到的PID。我对R和编码一般还是很陌生,因此可以提供任何帮助。谢谢!
head(OriginalPTs):
pid speed group
1 ALFE 1.418733 Original
2 ALFE 1.187550 Original
3 ALFE 0.536114 Original
4 ALFE 1.350950 Original
5 ALFE 1.505700 Original
6 ALFE 1.907850 Original
head(RetestPTs):
pid speed group
1 ALFE 1.4636500 Retest
2 ALFE 0.7094775 Retest
3 ALFE 0.4197050 Retest
4 ALFE 1.2798667 Retest
5 ALFE 1.4745000 Retest
6 ALFE 1.7771000 Retest
每个PID有多个条目。
我尝试过的内容:
left_join(OriginalPts,RetestPTs)
这将产生垂直联接,而不是水平联接。
我想同时看到两个数据帧。如果可以简化的话,我还会为每个人提供一个试用编号。
这项工作吗?
library(dplyr)
inner_join(OriginalPTs, RetestPTs, by = c("pid")