我有一个带有两列的数据帧,即时间戳和幅度。数据如下所示:
time stamps Magnitude
"2010-04-2 19:58:39 CEST" 1
"2010-04-2 19:58:49 CEST" 2
"2010-04-2 19:58:59 CEST" 3
"2010-04-2 19:59:09 CEST" 4
"2010-04-2 19:59:19 CEST" 5
"2010-04-2 19:58:40 CEST" 1
"2010-04-2 19:58:50 CEST" 2
"2010-04-2 19:58:60 CEST" 3
"2010-04-2 19:59:70 CEST" 4
"2010-04-2 19:59:80 CEST" 5
我想删除这些彼此不重复的类似时间戳。我已经尝试过基于重复行的子集,但显然这是行不通的。
这是使用lubridate
的示例。我假设您要删除在日期 - 小时 - 分钟级别重复的条目,即不考虑秒。
library(lubridate)
df[!duplicated(floor_date(df$timestamps, unit = "minute")), ]
# timestamps Magnitude
#1 2010-04-02 19:58:39 1
#4 2010-04-02 19:59:09 4
将单位更改为hour
或任何您需要的。